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内 容 提要 

本 书 是 一 部 UNIX 网 络 编程 的 经 典 之 作 ! 进程 间 通 信 APC 几乎 是 
所 有 UNIX 程 序 性 能 的 关键 ， 理 解 IPC 也 是 理解 如 何 开发 不 同 主机 间 网 络 
应 用 程序 的 必要 条 件 。 本 书 从 对 Posix IPC 和 System V IPC 的 内 部 结构 开 
台 讨 论 ， 全 面 深 入 地 介绍 了 4 种 IPC 形 式 : 消息 传递 〈 管 道 、FIFO、 消 
EMAD 、 同 步 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 文 件 与 记录 锁 、 信 和 号 
量 ) 、 共 宇内 存 〈 匿 名 共享 内 存 、 有 具名 共享 内 存 ) 及 远程 过 程 调 用 
(Solaris |]. Sun RPC) 。 附 录 中 给 出 了 测量 各 种 IPC 形 式 性 能 的 方 
is 

本 书 内 容 详尽 且 具 权威 性 ， 几 乎 每 章 都 提供 精 选 的 习题 ， 并 提供 了 
部 分 习题 的 答案 ， 是 网 络 研 究 和 开 有 人员 理想 的 参考 书 。 
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概述 

大 多 数 重 要 的 程序 都 涉及 进程 间 通 信 CInterprocess 
Communication,IPC) 。 这 是 受 下 述 设 计 原 则 影响 的 自然 结果 : 把 应 用 
程序 设计 为 一 组 相互 通信 的 小 片断 比 将 其 设计 为 单个 庞大 的 程序 更 好 。 
从 历史 角度 看 ， 应 用 程序 有 如 下 几 种 构建 方法 。 

(G) 用 一 个 庞大 的 程序 完成 全 部 工作 。 程 序 的 各 部 分 可 以 实现 为 函 
数 ， 男 数 之 间 通 过 参数 、 返 回 值 和 全 局 变量 来 交换 信息 。 

(2) 使 用 多 个 程序 ， 程 序 之 间 用 某 种 形式 的 IPC 进 行 通 信 。 许 多 标准 
的 UNIX 工 具 都 是 按 这 种 风格 设计 的 ， 它 们 使 用 shell 管 道 (IPC 的 一 种 形 
XO 在 程序 之 间 传 递 信 息 。 

(3) 使 用 一 个 包含 多 个 线程 的 程序 ， 线 程 之 间 使 用 某 种 IPC。 这 里 仍 
然 使 用 术语 IPC， 尽 管 通信 是 在 线程 之 间 而 不 是 在 进程 之 间 进 行 的 。 

还 可 以 把 后 两 种 设计 形式 结合 起 来 : 用 多 个 进程 来 实现 ， 其 中 每 个 
进程 包含 几 个 线程 。 在 这 种 情况 下 ， 进 程 内 部 的 线程 之 间 可 以 通信 ， 不 
同 的 进程 之 间 也 可 以 通信 。 

上 面 讲 述 了 可 以 把 完成 给 定 任 务 所 需 的 工作 分 到 多 个 进程 中 ， 或 许 
还 可 以 进一步 分 到 进程 内 的 多 个 线程 中 。 在 包含 多 个 处 理 器 (CPU) 的 
系统 中 ， 多 个 进程 也 许可 以 《在 不 同 的 CPU 上 ) 同时 运行 ， 或 许 给 定 进 
程 内 的 多 个 线程 也 能 同时 运行 。 因 此 ， 把 任务 分 到 多 个 进程 或 线程 中 有 
望 减少 完成 指定 任务 的 时 间 。 

本 书 详细 描述 了 以 下 4 种 不 同 的 IPC 形 式 : 























() 消 息 传 递 〈 管 道 、FIFO 和 消息 队列 ) ; 

(2) 同 步 〈《 互 斥 量 、 条 件 变量 、 读 写 锁 、 文 件 和 记录 锁 、 信 和 号 量 ) ; 

(3) 共 享 内 存 〈 匿 名 的 和 具名 的 ) ; 

(4) 远 程 过 程 调 用 〈Solaris 门 和 Sun RPC) 。 

本 书 不 讨论 如 何 编写 通过 计算 机 网 络 通 信 的 程序 。 这 种 通信 通常 涉 
及 使 用 TCP/IP 协 议 族 的 套 接 字 API， 相 关 主 题 在 第 1 卷 [Stevens 1998] 中 有 
详细 讨论 。 

有 人 可 能 会 提出 质疑 : 不 应 该 使 用 单 主 机 或 非 网 络 IPC《〈 本 卷 的 主 
题 ) ， 所 有 程序 都 应 该 网 络 上 的 多 台 主 机 上 同时 运行 。 但 在 日 常 实践 
中 ， 单 主机 IPC 往 往 比 网 络 通 信 快 得 多 ， 而 且 有 还 简单 些 。 共 享 内 存 、 
同步 等 方法 通常 也 只 能 用 于 单 主机 ， 跨 网 络 时 可 能 无 法 使 用 。 经 验 和 史 
表明 ， 非 网 络 IPC《 本 卷 ) 与 跨 网 络 IPC (第 1 卷 ) 都 是 需要 的 。 

本 卷 建立 在 第 1 卷 和 我 写 的 另外 4 本 书 的 基础 上 ， 这 5 本 书 在 本 书 中 
简 记 如 下 : 

UNPv1: UNIX Network Programming,Volume 1 [Stevens 1998]; 

APUE: Advanced Programming in the UNIX Environment [Stevens 
1992]; 

TCPv1: TCP/IP Illustrated, Volume 1 [Stevens 1994]; 

TCPv2: TCP/IP Illustrated, Volume 2 [Wright and Stevens 1995]; 

TCPv3: TCP/IP Illustrated, Volume 3 [Stevens 1996]. 

在 一 本 书 名 包含 “网 络 编程 ”的 书 中 讨论 IPC 看 似 有 点 奇怪 ， 但 事实 
上 IPC 经 常用 于 网 络 应 用 程序 。 我 在 《UNIX 网 络 编程 》1990 年 版 的 前 言 
里 就 指出 :“ 想 知道 如 何 为 网 络 开发 软件 ， 必 须 先 理 解 进程 间 通 信 
(IPC) a” 

与 第 1 版 的 区 别 

本 书 完全 重 写 并 扩充 了 1990 年 版 《UNIX 网 络 编程 》 的 第 3 章 和 第 18 
草 。 字 数 统计 表明 ， 现 在 的 内 容 是 第 1 版 的 5 倍 。 新 版 的 主要 改动 归纳 如 














T: 

不 仅 讨 论 了 “System V IPC” 的 三 种 形式 (消息 队列 、 a 
BA) ， 还 对 实现 了 这 些 IPC 的 新 的 Posix 函 数 进 行 了 介 (1.7 节 将 
详细 介绍 Posix 标 准 族 。) 我 认为 使 用 Posix IPC «RP. 因为 
它们 比 System V 中 的 相应 部 分 更 具 优势 。 

讨论 了 用 于 同步 的 Posix 函 数 : 互 斥 锁 、 条 件 变量 以 及 读 写 锁 。 它 
们 可 用 于 线程 或 进程 的 同步 ， 而 且 往 往 在 访问 共享 内 存 时 使 用 。 

本 卷 假定 使 用 Posix 线 程 环 境 ( 称 为 “Pthreads”) ， 许 多 示例 都 是 用 
多 线程 而 不 是 多 进程 构建 的 。 

对 管道 、FIFO 和 记录 锁 的 讨 t ENS TAE MIE osix ke XR. 

本 卷 不 仅 描述 了 IPC 机 制 及 其 使 用 方法 ， 人 了 Posix 消 息 队 列 、 
该 写 锁 与 Posix 信 号 量 〈 都 可 以 实现 为 用 户 库 ) 。 这 些 实现 可 以 把 多 种 
不 同 的 特性 捆绑 起 来 〈 例 如 ，Posix 信 号 量 的 一 种 实现 用 到 了 互 斥 量 、 
条 件 变 量 和 内 存 映 射 TO) ， 还 强调 了 我 们 在 应 用 程序 中 经 常 要 处 理 的 
一 些 问 题 ( 如 竞争 状态 、 错 误 处 理 、 内 存 泄漏 和 变 长 参数 列表 ) 。 理 解 
某 种 特性 的 实现 通常 有 助 于 了 解 如 何 使 用 该 特性 。 

对 RPC 的 讨论 侧重 于 Sun 的 RPC 包 。 在 此 之 前 讲述 了 新 的 Solaris|] 
API， 它 类 似 于 RPC 但 用 于 单 主 机 。 这 么 一 来 我 们 就 介绍 了 许多 在 调用 
其 他 进程 中 的 过 程 时 需要 考虑 的 特性 ， 而 不 用 关心 网 络 方面 的 细节 。 

读者 对 象 

本 书 既 可 以 用 作 IPC 的 教程 ， 也 可 以 用 作 有 经 验 的 程序 员 的 参考 
书 。 全 书 划 分 为 以 下 4 个 主要 音 

消息 传递 ; 

同步 ; 

共享 内 存 ; 

远程 过 程 调用 。 

但 许多 读者 可 能 只 对 特定 的 部 分 感 兴 趣 。 第 2 章 总 结 了 所 有 Posix 








IPC 函 数 共有 的 特性 ， 第 3 章 归 纳 了 所 有 System V IPC 函 数 共 有 的 特性 ， 
第 12 章 介绍 了 Posix 和 System V 的 共享 内 存 ， 但 书 中 多 数 章节 都 可 以 独立 
于 其 他 章 届 阅读 。 所 有 读者 都 应 该 阅读 第 1 革 ， 尤 其 是 1.6 节 ， 该 节 介 绍 
了 一 些 贯穿 全 书 的 包装 函数 。 讨 论 Posix IPC 的 各 章 与 讨论 System V IPC 
的 各 章 彼 此 独立 ， 有 关 管 道 、FIFO 和 记录 锁 的 几 间 不 属于 上 述 两 个 阵 
营 ， 关 于 RPC 的 两 章 也 独立 于 其 他 IPC 方 法 。 

为 了 方便 读者 把 本 书 作为 参考 书 ， 本 书 提供 了 完整 的 全 文 索引 ， 并 
在 最 后 几 页 总 结 了 每 个 函数 和 结构 的 详细 描述 在 正文 中 的 哪里 可 以 找 
到 。 为 了 给 不 按 顺 序 阅 读本 书 的 读者 提供 方便 ， 我 们 在 书 中 为 各 个 主题 
提供 了 大 量 的 交叉 引用 。 

源 代码 与 勘误 

书 中 所 有 示例 的 源 代码 可 以 从 作者 主页 〈 列 在 前 言 的 最 后 ) 获得 
[1] 。 学 习 本 书 讲述 的 IPC 技 术 的 最 好 方法 就 是 下 载 这 些 程序 ， 对 其 进行 
修改 和 改进 。 只 有 这 样 实际 编写 代码 才能 深入 理解 有 关 概 念 和 方法 。 
章 末 尾 都 提供 了 大 量 的 习题 ， 大 部 分 已 在 附录 DD 中 给 出 答案 。 

本 书 的 最 新 勘误 表 也 可 以 从 作者 主页 获取 。 
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[1]. 书 中 所 有 示例 的 源 代 码 也 可 以 从 图 灵 网 站 〈www.turingbook.com ) 
本 书 网 页 免费 注册 下 载 。 编者 注 
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1.1 概述 


IPC 是 进程 间 通 信 Cinterprocess communication) 的 简称 。 传 统 上 该 
术语 描述 的 是 运行 在 某 个 操作 系统 之 上 的 不 同 进程 间 各 种 消息 传递 
(message passing) 的 方式 。 本 书 还 讲述 多 种 形式 的 同步 
(synchronization) ， 因 为 像 共 享 内 存 区 这 样 的 较 新 式 的 通信 需要 某 种 
形式 的 同步 参与 运作 。 

在 Unix 操 作 系 统 过 去 30 年 的 演变 史 中 ， 消 息 传 递 历经 了 如 下 几 个 发 
展 阶段 。 

管道 Cpipe, 584380 是 第 一 个 广泛 使 用 的 IPC 形 式 ， 既 可 在 程序 中 
使 用 ， 也 可 从 shell 中 使 用 。 管 道 的 问题 在 于 它们 只 能 在 具有 共同 祖先 
( 指 父 子 进程 关系 〉 的 进程 间 使 用 ， 不 过 该 问题 已 随 有 名 管道 (named 
pipe) 即 FIFO《〈 第 4 章 ) 的 引入 而 解决 了 。 

System VÄ ÆJI] (System V message queue， 第 6 章 ) 是 在 20 世 纪 
80 年 代 早 期 加 到 System V 内 核 中 的 。 它 们 可 用 在 同一 主机 上 有 杀 缘 关系 
或 无 杀 缘 关系 的 进程 之 间 。 尽 管 称呼 它们 时 仍 冠 以 <System VIR, 4 
今 多 数 版 本 的 Unix 却 不 论 目 己 是 人 否 源 目 System V 都 支持 它们 。 

在 谈论 Unix 进 程 时 ， 有 亲缘 关系 (related) 的 说 法 意味 着 所 论 及 的 











进程 具有 某 个 共同 的 祖先 。 说 得 更 明白 点 ， 这 些 有 亲缘 关系 的 进程 是 从 
该 祖先 进程 经 过 一 次 或 多 次 fork 派 生来 的 。 一 个 常见 的 例子 是 在 某 个 进 
程 调用 fork 两 次 ， 派 生出 两 个 子 进程 。 我 们 说 这 两 个 子 进程 是 有 亲 毕 关 
系 的 。 同 样 ， 每 个 子 进程 与 其 父 进 程 也 是 有 亲缘 关系 的 。 考 虑 到 IPC， 
父 进程 可 以 在 调用 fork 前 建立 某 种 形式 的 IPC【〔 例 如 管道 或 消 恩 队 
列 ) ， 因 为 它 知 道 随后 派生 的 两 个 子 进程 将 罕 越 fork 继 承 该 IPC 对 象 。 
我 们 随 图 1-6 详 细 讨 论 各 种 IPC 对 象 的 继承 性 。 我 们 还 得 注意 ， 从 理论 上 
说 ， 所 有 Unix 进 程 与 init 进 程 都 有 亲缘 关系 ， 它 是 在 系统 自 举 时 启动 所 
有 初始 化 进程 的 祖先 进程 。 然 而 从 实践 上 说 ， 进 程 杀 缘 关 系 开始 于 一 个 
登录 shell 〈 称 为 一 个 会 话 ) 以 及 由 该 shell 派 生 的 所 有 进程 。APUE 的 第 9 
章 详 细 讨 论 会 话 和 进程 亲缘 关系 。 

本 书 将 全 文 使 用 缩 进 的 插入 式 注解 《如 此 处 所 示 ) 来 说 明 实 现 上 的 
细节 、 历 史上 的 观点 以 及 其 他 琐事 。 

Posix 消 息 队 列 〈Posix 消 息 队 列 ， 第 5 章 ) 是 由 Posix 实 时 标准 
《1003.1b-1993， 将 在 1.7 节 详细 讨论 ) 加 入 的 。 它 们 可 用 在 同一 主机 上 
有 亲缘 关系 和 无 杀 缘 关系 的 进程 之 间 。 

远程 过 程 调用 (Remote Procedure Call，RPC， 第 五 部 分 ) 出 现在 
20 世 纪 80 年 代 中 期 ， 它 是 从 一 个 系统 (客户 主机 〉 上 某 个 程序 调用 另 一 
个 系统 (服务 器 主机 〉 上 某 个 函数 的 一 种 方法 ， 是 作为 显 式 网 络 编程 的 
一 种 蔡 换 方法 开发 的 。 既 然 客 户 和 服务 器 之 间 通 常 传递 一 些 信息 《被 调 
用 函数 的 参数 与 返回 值 ) ， 而 且 RPC 可 用 在 同一 主机 上 的 客户 和 服务 器 
之 间 ， 因 此 可 认为 RPC 是 为 一 种 形式 的 消息 传递 。 

看 一 看 由 Unix 提 供 的 各 种 同步 形式 的 演变 同样 占有 教 益 。 

需要 某 种 同步 形式 (往往 是 为 了 防止 多 个 进程 同时 修改 同一 文件 ) 
的 早期 程序 使 用 了 文件 系统 的 诡秘 特性 ， 我 们 将 在 9.8 节 讨论 其 中 的 一 


i, 





记录 上 锁 (record locking， 第 9 章 ) 是 在 20 世 纪 80 年 代 早 期 加 到 


Unix 内 核 中 的 ， 然 后 在 1988 年 由 Posix.1 标 准 化 的 。 

System V 信 号 量 (System V semaphore， 第 11 章 ) 是 在 System V 消 
息 队 列 加 入 System V 内 核 的 同时 〈20 世 纪 80 年 代 早 期 ) 伴随 System VIE 
享 内 存 区 (System V shared memory) 加 入 的 。 当 今 多 数 版 本 的 Unix 都 
支持 它们 。 

Posix 信 号 量 (Posix semaphore， 第 10 章 ) 和 Posix 共 享 内 存 区 
(Posix shared memory， 第 13 章 ) 也 由 Posix 实 时 标准 (1003.1b-1993) 
加 入 。 

TLFRSÉ Cmutex) 和 条 件 变量 (condition variable， 第 7 章 ) 是 由 
Posix 线 程 标 准 〈1003.1c-1995) 定义 的 两 种 同步 形式 。 尽 管 往往 用 于 线 
程 间 的 同步 ， 它 们 也 能 提供 不 同 进 程 间 的 同步 。 

读 写 锁 (read-write lock， 第 8 章 ) 是 另 一 种 形式 的 同步 。 和 它们 还 没 
有 被 Posix 标 准 化 ， 不 过 也 许 不 久 后 会 被 标准 化 。 

















按照 传统 的 Unix 编 程 模 型 ， 我 们 在 一 个 系统 上 运行 多 个 进程 ， 每 个 
进程 都 有 各 自 的 地 址 空间 。Unix 进 程 间 的 信息 共享 可 以 有 多 种 方式 。 图 
1-1 对 此 作 了 总 结 。 
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图 1-1 Unix 进 程 则 共享 信息 的 三 种 方式 


(1) 左 边 的 两 个 进程 共享 存留 于 文件 系统 中 某 个 文件 上 的 某 些 信息 。 
为 访问 这 些 信息 ， 每 个 进程 都 得 穿越 内 核 〈 例 如 read、write、lseek 
等 ) 。 当 一 个 文件 有 竺 更 新 时 ， 某 种 形式 的 同步 是 必要 的 ， 这 样 既 可 保 
护 多 个 写 入 者 ， 防 止 相互 串扰 ， 也 可 保护 一 个 或 多 个 读 出 者 ， 防 止 写 入 
WF 

(2) 中 间 的 两 个 进程 共享 驻 留 于 内 核 中 的 某 些 信息 。 管 道 是 这 种 共享 
类 型 的 一 个 例子 ， System V 消 县 队列 和 System V 信 号 量 也 是 。 现 在 访问 
共享 信息 的 每 次 操作 涉及 对 内 核 的 一 次 系统 调用 。 

(3) 右 边 的 两 个 进程 有 一 个 双方 都 能 访问 的 共享 内 存 区 。 每 个 进程 一 
日 设置 好 该 共享 内 存 区 ， 就 能 根本 不 涉及 内 核 而 访问 其 中 的 数据 。 共 至 
该 内 存 区 的 进程 需要 某 种 形式 的 同步 。 

注意 没有 任何 东西 限制 任何 IPC 技 术 只 能 使 用 两 个 进程 。 我 们 讲述 
的 技术 适用 于 任意 数目 的 进程 。 在 图 1-1 中 只 展示 两 个 进程 是 为 了 简单 
起 见 。 

线程 

虽然 Unix 系 统 中 进程 的 概念 已 使 用 了 很 入， 一 个 给 定 进程 内 多 个 线 
f£ (thread) 的 概念 却 相 对 较 新 。Posix.1 线 程 标准 〈 称 为 "Pthreads”) 是 
于 1995 年 通过 的 。 从 IPC 角 度 看 来 ， 一 个 给 定 进程 内 的 所 有 线程 共享 同 
样 的 全 局 变量 〈 也 就 是 说 共享 内 存 区 的 概念 对 这 种 模型 来 说 是 内 在 
的 ) 。 然 而 我 们 必须 关注 的 是 各 个 线程 间 对 全 局 数据 的 同步 访问 。 同 步 
尽管 不 是 一 种 明确 的 IPC 形 式 ， 但 它 确实 伴随 许多 形式 的 IPC 使 用 ， 以 控 
制 对 某 些 共享 数据 的 访问 。 

本 书 中 我 们 讲述 进程 间 的 IPC 和 线程 间 的 IPC。 我 们 假设 有 一 个 线程 
环境 ， 并 作 类 似 如 下 形式 的 陈述 :“ 如 果 管 道 为 空 ， 调 用 线程 承 阻 塞 在 
它 的 read 调 用 上 ， 直 到 某 个 线程 往 该 管道 写 入 数据 。” 要 是 你 的 系统 不 文 
持 线 程 ， 那 你 可 以 将 该 句子 中 的 “线程 ” 蔡 换 成 “进程 "， 从 而 提供 “阻截 
在 对 空 管道 的 read 调 用 上 ”的 经 典 Unix 定 义 。 然 而 在 支持 线程 的 系统 上 ， 





























只 有 对 空 管道 调用 read 的 那个 线程 阻塞 ， 同 一 进程 中 的 其 余 线程 才 可 以 
继续 执行 。 辐 该 空 管道 写 数据 的 工作 既 可 以 由 同一 进程 中 的 吃 一 个 线程 
去 做 ， 也 可 以 由 为 一 个 进程 中 的 杂 个 线程 去 做 。 

附录 B 汇 总 了 线程 的 条 些 特征 以 及 全 书 都 用 到 的 5 个 基本 的 Pthread 


1.3 IPC» J 持续 性 


我 们 可 以 把 任意 类 型 的 IPC 的 持续 性 (persistence) 定义 成 该 类 型 的 
一 个 对 象 一 直 存 在 多 长 时 间 。 图 1-2 展 示 了 三 种 类 型 的 持续 性 。 


随 进程 持续 的 IPC: 一 直 存 在 到 打开 着 IPC 
对 象 的 最 后 一 个 进程 关闭 该 对 象 为 目 


自 举 或 显 式 删除 IPC 对 象 为 止 





. 
Iren 一 直 存 在 到 内 核 重 新 


随 文件 系统 持续 的 IPC: 一 直 存 在 到 显 式 
删除 IPC 对 象 为 止 


图 1-2 IPC 对 象 的 持续 性 
(1) 随 进程 持续 的 (process-persistent)〉 IPC 对 象 一 直 存 在 到 打开 着 该 
对 象 的 最 后 一 个 进程 关闭 该 对 象 为 止 。 例 如 管道 和 FIFO 就 是 这 种 对 象 。 
(2) 随 内 核 持 续 的 《〈kernel-persistent) IPC 对 象 一 直 存 在 到 内 核 重 新 


自 举 或 显 式 删除 该 对 象 为 止 。 例 如 System V 的 消息 队列 、 信 号 量 和 共享 
内 存 区 就 是 此 类 对 象 。Posix 的 消息 队列 、 信 和 号 量 和 共享 内 存 区 必须 至 
少 是 随 内 核 持 续 的 ， 但 也 可 以 是 随 文 件 系 统 持续 的 ， 具 体 取决 于 实现 。 

(3) 随 文件 系统 持续 的 Cfilesystem-persistent) IPC 对 象 一 直 存 在 到 显 
式 删除 该 对 象 为 止 。 即 使 内 核 重 新 自 举 了 ， 该 对 象 还 是 保持 其 值 。 
Posix 消 息 队 列 、 信 号 量 和 共享 内 存 区 如 果 是 使 用 映射 文件 实现 的 《不 
是 必需 条 件 ) ， 那 么 它们 就 是 随 文件 系统 持续 的 。 

在 定义 一 个 IPC 对 象 的 持续 性 时 我 们 必须 小 心 ， 因 为 它 并 不 总 是 像 
看 起 来 的 那样 。 例 如 管道 内 的 数据 是 在 内 核 中 维护 的 ， 但 管道 具备 的 是 
随 进程 的 持续 性 而 不 是 随 内 核 的 持续 性 : 最 后 一 个 将 某 个 管道 打开 着 用 
于 恋 的 进程 关闭 该 管道 后 ， 内 核 将 丢弃 所 有 的 数据 并 删除 该 管道 。 类 似 
地 ， 尺 管 FIFO 在 文件 系统 中 有 名 字 ， 它 们 也 只 是 具备 随 进 程 的 持续 性 ， 
因为 最 后 一 个 将 某 个 FIFO 打 开 着 的 进程 关闭 该 FIFO 后 ，FIFO 中 的 数据 
都 被 丢弃 。 

图 1-3 汇 总 了 将 在 本 书 中 讲述 的 各 种 类 型 IPC 对 象 的 持续 性 。 








随 进程 

Posix H. Fr fit BG ERE 

Posix 条 件 变量 随 进程 

Posix 读 写 锁 随 进 程 

fcnt1 记 录 上 锁 随 进 程 

Posix 消 息 队 列 随 内 核 

Posix 有 名 信号 量 随 内 核 

Posix 基 于 内 存 的 信号 量 随 进程 

Posix 共 再 内 存 区 随 内 核 

System Vili Æ BÀ FI 随 内 核 

System V 信 和 号 量 随 内 核 

System V 共 享 内 存 区 随 内 核 

TCP 套 接 字 随 进 程 

UDP 套 接 字 随 进程 

Unix 域 套 接 字 随 进程 

图 1-3 各 种 类 型 IPC 对 象 的 持续 性 
注意 该 列表 中 没有 任何 类 型 的 IPC 具 备 随 文件 系统 的 持续 性 ， 但 是 

我 们 说 过 有 三 种 类 型 的 Posix IPC 可 能 会 具备 该 持续 性 ， 这 取决 于 它们 的 
实现 。 显 然 ， 同 一 个 文件 写 入 数据 提供 了 随 文 件 系 统 的 持续 性 ， 但 这 通 
常 不 作为 一 种 IPC 形 式 使 用 。 多 数 形式 的 IPC 并 没有 在 系统 重新 自 举 后 继 
续 存 在 的 打算 ， 因 为 进程 不 可 能 跨越 重新 自 举 继续 存活 。 对 于 一 种 给 定 
形式 的 IPC， 要 求 它 具备 随 文件 系统 的 持续 性 可 能 会 使 其 性 能 降级 ， 而 
IPC 的 一 个 基本 的 设计 目标 是 高 性 能 。 
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当 两 个 或 多 个 无 亲缘 关系 的 进程 使 用 某 种 类 型 的 IPC 对 象 来 彼此 交 
换 信 息 时 ， 该 IPC 对 象 必 须 有 一 个 某 种 形式 的 名 字 (ame) 或 标识 符 
(identifier) ， 这 样 其 中 一 个 进程 (往往 是 服务 器 〉 可 以 创建 该 IPC 对 
象 ， 其 余 进程 则 可 以 指定 同一 个 IPC 对 象 。 

管道 没有 名 字 (因此 不 能 用 于 无 亲缘 关系 的 进程 间 〉 ， 但 是 FIFO 有 
一 个 在 文件 系统 中 的 Unix 路 径 名 作为 其 标识 符 ( 因 此 可 用 于 无 杀 缘 关系 
的 进程 间 ) 。 在 以 后 各 章 具 体 讲述 其 他 形式 的 IPC 时 ， 我 们 将 使 用 另外 
的 命名 约定 。 对 于 一 种 给 定 的 IPC 类 型 ， 其 可 能 的 名 字 的 集合 称 为 它 的 
名 字 空 间 (name space) 。 名 字 空 间 非 常 重 要 ， 因 为 对 于 除 普通 管道 以 
外 的 所 有 形式 的 IPC 来 说 ， 名 字 是 客户 与 服务 器 彼此 连接 以 交换 消息 的 
手段 。 

图 1-4 汇 总 了 不 同形 式 的 IPC 所 用 的 命名 约定 。 

我 们 还 指出 哪些 形式 的 IPC 是 由 1996 年 版 的 Posix.1 和 Unix 98 标 准 化 
的 ， 这 两 个 标准 本 身 则 在 1.7 节 详细 讨论 。 为 了 比较 的 目的 ， 我 们 还 包 
含 了 三 种 类 型 的 套 接 字 ， 它 们 在 UNPv1 中 具体 讲述 。 注 意 套 接 字 
API (应 用 程序 编程 接口 ) 是 由 Posix.1g 工 作 组 标准 化 的 ， 最 终 应 该 成 为 
某 个 未 来 的 Posix.1 标 准 的 一 部 分 。 


























用 于 打开 或 创建 Es MTS Posix.1 : 


管道 (RAAF) 描述 符 

FIFO 路 径 名 描述 符 

Posix H. Jk it (没有 名 字 ) pthread mutex t 指 针 
Posix 条 件 变 量 (没有 名 字 ) pthread cond t 指 针 
Posix i3: *3 fi (没有 名 字 ) pthread rwlock t 指 针 
fcnt1 记 录 上 锁 路 径 名 描述 符 

Posix 消 息 队列 Posix IPC 名 字 mgd t 值 

Posix 有 名 信和 号 量 Posix IPC 名 字 sem ttftt 


Posix 基 于 内 存 的 信和 号 量 (没有 名 字 ) sem tjHfl 
Posix 共 享 内 存 区 Posix IPC 名 字 描述 符 


System V 消 息 队 列 System V IPC 标 识 符 
System V 信 与 量 System V IPC 标 识 符 
System V 共 享 内 存 区 System V IPC 标 识 符 


i 路 径 名 描述 符 
Sun RPC 程序 /版 本 RPC 和 句柄 


TCP 套 接 字 IP 地 址 与 TCP 端 口 描述 符 
UDP 套 接 字 耻 地 址 与 UDP 端口 描述 符 
Unix 域 套 接 字 路 径 名 描述 符 


图 1-4 各 种 形式 IPC 的 名 字 空 间 
尽管 Posix.1 标 准 化 了 信号 量 ， 它 们 仍然 是 可 选 的 特性 。 图 1-5 汇 总 
了 Posix.1 和 Unix 98 对 各 种 IPC 特 性 的 说 明 。 每 种 特性 有 强制 、 未 定义 和 
可 选 三 种 选择 。 对 于 可 选 的 特性 ， 我 们 指出 了 其 中 每 种 特性 受 文 持 时 
OÆ <unistd.h> ALFF) 定义 的 常 值 的 名 字 ， 例 如 
_POSIX_THREADS。 注 意 ，Unix 98 是 Posix.1 的 超 集 。 
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Posix 信 号 量 _POSIX SEMAPHORES _XOPEN REALTIME 
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图 1-5 各 种 形式 IPC 的 可 用 性 











我 们 需要 理解 fork、exec 和 _exit 函 数 对 于 所 讨论 的 各 种 形式 的 IPC 的 
影响 〈_exit 是 由 exit 调 用 的 一 个 函数 ) 。 图 1-6 对 此 作 了 总 结 。 
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子 进 程 取得 父 进 程 的 所 有 打 
开 着 的 描述 符 的 副本 


了 进程 取得 父 进程 的 所 有 打 


所 有 打开 着 的 描述 符 继 续 
打开 着 ， 除 非 已 设置 描述 符 
的 FD_CLOEXEC 位 

关闭 所 有 打开 着 的 消息 队 


关闭 所 有 打开 着 的 描述 
符 ， 最 后 一 个 关闭 时 删除 管 
道 或 FIFO 中 残留 的 所 有 数据 
关闭 所 有 打开 着 的 消息 队 


Posix 消 息 队 列 
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System V 消 息 队列 | ”没有 效果 没有 效果 没有 效果 
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若 驻 留 在 共享 内 存 区 中 而 且 
具有 进程 间 共享 属性 ， 则 共享 


若 驻 留 在 共享 内 存 区 中 而 且 


具有 进程 间 共享 属性 ， 则 共享 


若 驻 留 在 共享 内 存 区 中 而 且 


具有 进程 间 共 享 属性 ， 则 共享 


父 进程 中 所 有 打开 着 的 有 名 


信号 量 在 子 进程 中 继续 打开 着 


除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 县 有 进程 间 共 
享 属性 ， 否 则 消失 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属 性 ， 和 否则 消失 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属性 ， 否 则 消失 

关闭 所 有 打开 着 的 有 名 
信号 量 
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除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 有 具有 进程 间 共 
sra, rij 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属性 ， 和 否则 消失 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属性 ， 和 否则 消失 

关闭 所 有 打开 着 的 有 名 
信号 量 

所 有 semadj 值 都 加 到 相应 
的 信号 遇 值 上 


子 进程 中 所 有 semadj 值 都 置 
为 0 


fcnt1 记 录 上 锁 


了 进程 不 继承 由 父 进程 持 有 
的 锁 


只 要 描述 符 继 续 打开 着 ， 
锁 就 不 变 


解 开 由 进程 持 有 的 所 有 未 
处 理 的 锁 


mmap 内 存 映 射 父 进程 中 的 内 存 映 射 存留 到 
子 进程 中 

父 进 程 中 的 内 存 映 射 存 贸 到 
子 进程 中 

附 接 着 的 共享 内 存 区 在 子 进 
程 中 继续 附 接着 

子 进 程 取得 父 进程 的 所 有 打 
开 着 的 描述 符 ， 但 是 客户 在 门 
描述 符 上 激活 其 过 程 时 ， 只 有 
父 进程 是 服务 器 


图 1-6 调用 fork、exec 和 _exit 对 于 IPC 的 影响 
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所 有 门 描 述 符 都 应 关闭 ， 因 关闭 所 有 打开 着 的 描述 符 
为 它们 创建 时 设置 了 
FD_CLOEXEC 位 
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表 中 多 数 特性 将 在 以 后 的 章节 中 讲述 ， 不 过 我 们 需要 强调 几 点 。 首 











先 ， 考 虑 到 无 名 同步 变量 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 基 于 内 存 的 信 
号 量 ) ， 从 一 个 具有 多 个 线程 的 进程 中 调用 fork 将 变 得 混乱 不 堪 。 

[Butenhof 1997] 的 6.1 市 提供 了 其 中 的 细节 。 我 们 在 表 中 只 是 简单 地 
注 明 : 如 果 这 些 变量 驻 留 在 共享 内 存 区 中 ， 而 且 创 建 时 设置 了 进程 间 共 
享 属性 ， 那 么 对 于 能 访问 该 共享 内 存 区 的 任意 进程 来 说 ， 其 任意 线程 能 
继续 访问 这 些 变 量 。 其 次 ，System V IPC 的 三 种 形式 没有 打开 或 关闭 的 





说 法 。 我 们 将 从 图 6-8 和 习题 11.1 和 习题 14.1 中 看 出 ， 访 问 这 三 种 形式 的 
IPC 所 需 知 道 的 只 是 一 个 标识 符 ， 因 此 知道 该 标识 符 的 任何 进程 都 能 访 
问 它 们 ， 尽 管 信 号 量 和 共享 内 存 区 可 附带 提出 某 种 特殊 处 理 要 求 。 
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在 现实 程序 中 ， 我 们 必须 检查 每 个 函数 调用 是 否 返 回 错误 。 由 于 页 
到 错误 时 终止 程序 执行 是 个 惯例 ， 因 此 我 们 可 以 通过 定义 包 右 函数 
(wrapper function) 来 缩短 程序 的 长 度 。 包 囊 函 数 执行 实际 的 函数 调 
用 ， 测 试 其 返回 值 ， 并 在 碰 到 错误 时 终止 进程 。 我 们 使 用 的 命名 约定 是 
将 函数 名 第 一 个 字母 改 为 大 写字 母 ， 例 如 : 

Sem_post(ptr); 

1-75 X. f 3X4 ELSE PR 


lib/wrapunix.c 





387 void 

388 Sem post(sem t *sem) 

389 ( 

390 if (sem post(sem) -- -1) 

391 err sys("sem post error"); 

392 } 

lib/wrapunix.c 








图 1-7 sem_post Ai BLA) £22& PRI BL 

每 当 你 过 到 一 个 以 大 写字 母 打头 的 函数 名 时 ， 它 就 是 我 们 所 说 的 包 
里 函数 。 它 调用 一 个 名 字 相 同 但 以 相应 小 写字 母 开 头 的 实际 函数 。 当 辜 
到 错误 时 ， 包 囊 函 数 总 是 在 输出 一 个 出 错 消息 后 终止 。 

我 们 在 讲解 书 中 提供 的 源 代 人 码 时 ， 所 指 代 的 总 是 被 调用 的 最 低层 函 
数 〈 例 如 sem_post) ， 而 不 是 包 于 函数 (例如 Sem_post) 。 类 似 地 ， 书 
后 的 索引 也 总 是 指 代 被 调用 的 最 低层 函数 ， 而 不 是 指 代 包 衷 函 数 。 

刚刚 展示 的 源 代码 格式 全 书 都 在 使 用 。 每 一 非 空 行 都 被 编写。 代码 
的 正文 说 明 部 分 的 左边 标 有 起 始 与 结束 的 行 号 。 有 的 段落 开始 处 含有 一 
个 醒目 的 简短 标题 ， 概 述 本 段 代 码 的 内 容 。 





源 代码 片段 起 始 与 结束 处 的 水 平 划 线 标 出 了 该 户 段 所 在 源 代 码 文 件 
名 ， 本 例 中 就 是 lb 目录 下 的 wrapunix.c 文 件 。 既 然 本 书 所 有 例子 的 源 代 
码 都 可 免费 获得 ( 见 前 言 》， 你 就 可 以 和 赁 这 个 文件 名 找到 相应 的 文件 。 
阅读 本 书 的 过 程 中 ， 编 译 、 运 行 并 修改 这 些 程 序 是 学 习 进 程 间 通信 概念 
的 好 方法 。 

尽管 包 囊 函数 不 见得 如 何 节省 代码 量 ， 当 在 第 7 章 中 讨论 线程 时 ， 
我 们 会 发 现 线程 函数 出 错时 并 不 设置 标准 的 Unix emot; 相反， 本 
该 设置 ermo 的 值 改 由 线程 函数 作为 其 返回 值 返 回调 用 者 。 这 意味 着 我 们 
每 次 调用 任意 一 个 线程 函数 时 ， 都 得 分 配 一 个 变量 来 保存 函数 返回 值 ， 
然后 在 调用 我 们 的 err_sys 函 数 ( 图 C-4) 前 ， 把 errmmo 设 置 成 所 保存 的 
值 。 为 避免 源 代 人 码 中 到 处 出 现 花 括 弧 ， 我 们 可 以 使 用 C 语 言 的 逗号 运算 
符 ， 把 给 errno 赋 值 与 调用 err_sys 组 合成 单个 语句 ， 如 下 所 示 : 


int n; 

















if ( (n = pthread mutex lock(&ndone mutex))!- 0) 
errno 7 n,err sys("pthread mutex lock error"); 
另 一 种 办 法 是 定义 一 个 新 的 出 错 处 理 函 数 ， 它 需要 的 另 一 个 参数 是 
系统 的 错误 号 [1] 。 但 是 我 们 可 以 将 这 段 代 码 简 化 得 更 容易 些 : 
Pthread_mutex_lock(&ndone_mutex); 


其 前 提 是 定义 自己 的 包 囊 函数 ， 如 图 1-8 所 示 。 





lib/wrappthread.c 





125 void 

126 Pthread mutex lock(pthread mutex t *mptr) 
127 ( 

128 int n; 

129 if ( (n = pthread mutex lock(mptr)) == 0) 
130 return; 

131 errno - n; 

132 err sys("pthread mutex lock error"); 

133 j} 


lib/wrappthread.c 





图 1-8 24pthread_mutex_lock xe X FY) 12 eh BL 
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不 过 即使 有 过 的 话 ， 包 囊 函 数 也 很 少 是 程序 性 能 的 瓶颈 所 在 。 

选择 将 函数 名 的 第 一 个 字母 大 写 是 一 种 较 折 中 的 方法 。 还 有 许多 其 
他 方法 : 例如 用 e 作 为 函数 名 的 前 组 CAU [Kernighan and Pike 1984] 第 
184 页 所 示 ) ， 或 者 用 _e 作 为 函数 名 的 后 绥 等 。 同 样 提供 确实 在 调用 某 
个 其 他 函数 的 可 视 化 指示 ， 我 们 的 方法 看 来 是 最 少 分 散人 们 的 注意 
的 。 

这 种 技巧 还 有 助 于 检查 那些 其 错误 返回 值 通 常 被 忽略 的 函数 ， 例 如 
close 和 pthread_mutex_lock。 

本 书后 面 的 例子 中 我 们 将 普遍 使 用 包 于 函 数 ， 除 非 必 须 检 查 某 个 确 
定 的 错误 并 处 理 它 《而 不 是 终止 进程 ) 。 我 们 并 不 给 出 所 有 包 囊 函数 的 
源 代 码 ， 但 它们 是 免费 可 得 的 〈 见 前 言 ) 。 

Unix errno 值 

每 当 在 一 个 Unix 函 数 中 发 生 错 误 时 ， 全 局 变量 errmno 将 被 设置 成 一 个 
站 示 错 误 类 型 的 正 数 ， 函 数 本 里 则 通常 返回 -1。 我 们 的 err_sys 函 数 检查 
ermo 的 值 并 输出 相应 的 出 错 消息 ， 例 如 ， ”errno 的 值 等 于 EAGAIN 时 的 
出 错 消息 为 “Resource temporarily unavailable" CAYMAN ABA) 。 

errno 的 值 只 在 某 个 函数 发 生 错 误 时 设置 。 如 果 该 函数 不 返回 错误 ， 
errno 的 值 就 无 定义 。 所 有 正 的 错误 值 都 是 常 值 ， 具 有 以 E 打 头 的 全 部 为 
大 写字 母 的 名 字 ， 通 党 定义 在 头 文 件 <sys/errno.h> 中 。 没 有 值 为 0 的 错 
Reo 

在 多 线程 环境 中 ， 每 个 线程 必须 有 自己 的 errno 变 量 。 提 供 一 个 局 限 
于 线程 的 errno 变 量 的 隐 式 请 求 是 自动 处 理 的 ， 不 过 通常 需要 告诉 编译 器 
所 编译 的 程序 是 可 重 入 的 。 给 编译 器 指定 类 似 -D_REENTRANT 或 - 
D_POSIX_C_SOURCE=199506L 这 样 的 命令 行 选 项 是 较 典 型 的 方法 。 
<errno.h> 头 文件 往往 把 errno 定 义 成 一 个 宏 ， 当 常 值 _REENTRANT 有 定 
义 时 ， 该 宏 就 扩展 成 一 个 函数 ， 由 它 访问 errno 变 量 的 某 个 局 限于 线程 的 
副本 。 



































全 书 使 用 类 似 “mq_send 函 数 返 回 EMSGSIZE 错 误 ” 的 用 语 来 简略 地 
表示 这 样 的 意思 : 该 函数 返回 一 个 错误 〈 典 型 情况 是 返回 值 为 -1) ， 并 
且 在 errno 中 设置 了 指定 的 常 值 。 


1.7 Unix 标 准 


有 关 Unix 标 准 化 的 大 多 数 活 动 是 由 Posix 和 Open Group 做 的 。 

1.7.1 Posix 

Posix 是 “可 移植 操作 系统 接口 ”(Portable Operating System 
Interface) 的 首 字 母 缩写 。 它 并 不 是 一 个 单一 标准 ， 而 是 一 个 由 电气 与 
电子 工程 师 学 会 即 IEEE 开 发 的 一 系列 标准 。Posix 标 准 还 是 由 ISO (国际 
标准 化 组 织 ) MIEC (国际 电工 委员 会 ) 采纳 的 国际 标准 ， 这 两 个 组 织 
合 称 为 ISOTIEC。Posix 标 准 经 历 了 以 下 若干 代 。 

IEEE Std 1003.1-1988 (2531771) 是 第 一 个 Posix 标 准 。 它 说 明 进 入 
类 Unix 内 核 的 C 语 言 接 口 ， 涉 及 下 列 领 域 : 进程 原 语 (fork、exec、 信 
号 、 定 时 器 ) 、 进 程 环 境 〈 用 户 ID、 进 程 组 ) 、 文 件 与 目录 (所 有 IO 
函数 ) 、 终 端 WO、 系 统 数据 库 (口令 文件 和 用 户 组 文件 ) 、tar 与 cpio 归 
档 格 式 。 

第 一 个 Posix 标 准 是 出 现 于 1986 年 称 为 TEEEIX” 的 试用 版 本 。Posix 
这 个 名 字 是 由 Richard Stallman 建 议 使 用 的 。 

IEEE Std 1003.1-1990( 共 356 页 ) 是 下 一 个 Posix 标 准 ， 它 也 是 国际 
标准 ISO/EC 9945-1:1990。 从 1988 年 版 本 到 1990 年 版 本 只 做 了 少量 的 修 
改 。 新 添 的 副标题 为 “Part 1: System Application Program Interface (API) 
[C Language]”， 指 示 本 标准 为 C 语 言 API。 

IEEE Std — 1003.2-1992 出 版 成 两 卷 本 ， 共 约 1300 页 ， 其 副标题 
为 “Part2: Shell and Utilities”。 这 一 部 分 定义 了 shell (基于 System V 的 
Bourne shell) 和 大 约 100 个 实用 程序 〈 即 通常 从 shell 局 动 执 行 的 程序 ， 














包括 awk、basename、vi 和 yacc 等 ) 。 本 书 称 这 个 标准 为 Posix.2。 

IEEE Std 1003.1b-1993( 共 590 页 〉 先 前 称 为 IEEE P1003.4。 这 是 对 
1003.1-1990 标 准 的 更 新 ， 添 加 了 由 P1003.4 工 作 组 开发 的 实时 扩展 : 文 
件 同步 、 异 步 JO、 信 和 号 量 、 内 存 管理 (mmap 和 共享 内 存 区 ) 、 执 行 调 
度 、 时 钟 与 定时 器 、 消 息 队 列 。 

IEEE Std 1003.1，1996 年 版 [IEEE 1996] 包括 1003.1-1990 (基本 
API) . 1003.1b-1993 (SEIN Fe) ~ 1003.1c-1995 (Pthreads) 和 
1003.1i-1995 (对 1003.1b 的 技术 性 修正 〉。 这 个 标准 也 称 为 I SO/IEC 
9945-1: 1996。 其 中 增加 了 三 章 线程 内 容 以 及 有 关 线 程 同步 〈 互 斥 锁 和 
条 件 变 量 ) 、 线 程 调 度 和 同步 调度 的 额外 各 节 。 本 书 称 这 个 标准 为 
Posix.1. 

743 页 中 有 四 分 之 一 强 的 篇 幅 是 标题 为 “Rationale and Notes” (JE 
与 注解 ) 的 附录 。 这 些 原理 含有 历史 性 信息 以 及 某 些 特性 必须 加 入 或 删 
除 的 理由 ， 它 们 通常 跟 正 式 标准 一 样 有 教 益 。 

遗憾 的 是 IEEE 标 准 在 因特网 上 不 是 免费 可 得 的 。 其 订购 信息 在 
LIEEE 1996] 的 参考 文献 说 明 中 给 出 。 

注意 信号 量 在 实时 标准 中 定义 ， 它 与 在 Pthreads 标 准 中 定义 的 互 斥 
锁 和 条 件 变 量 相 分 离 ， 这 足以 解释 它们 的 API 中 存在 的 某 些 差异。 

BOWERS BM (MD 不 属于 任何 Posix 标 准 。 我 们 将 在 第 8 章 中 详 
细 讨 论 。 

将 来 某 个 时 候 印 制 的 新 版 本 的 IEEE Std ”1003.1 应 包括 P1003.lg 标 
准 ， 它 是 我 们 在 UNPvI 中 讲述 的 网 络 编程 API( 套 接 字 和 XTI)》。 

1996 年 版 的 Posix.1 标 准 的 前 言 中 声称 ISO/IEC 9945 由 下 面 三 个 部 分 
构成 。 

Part 1: System application program interface (API)[C Language] (第 一 
BEAR: 系统 应 用 程序 接口 CAPD [Cif SD 。 

Part 2: Shell and utilities (第 二 部 分 : Shell 和 实用 程序 )。 


























Part 3: System administration (第 三 部 分 系统 管理 ) (正在 开发 
HH) 

第 一 部 分 和 第 二 部 分 就 是 我 们 所 称 的 Posix.1 和 Posix.2。 

Posix 标 准 化 工作 仍 将 继续 ， 任 何 论述 到 它 的 书籍 都 在 跟踪 这 项 工 
作 。 从 http:/www.pasc.org/standing/sdll.html 可 获得 各 种 Posix 标 准 的 最 新 
状态 。 

1.7.2 Open Group 

Open Group 是 由 X/Open 公司 1984 年 成 立 ) 和 开放 软件 基金 会 
COSF, 19884F Akar) 于 1996 年 合并 而 成 的 组 织 。 它 是 由 三家、 业界 最 
终 用 户 、 政 府 部 门 和 学 术 机 构 组 成 的 国际 组 织 。 它 们 的 标准 经 历 了 以 下 
FTN 

X/Open 公司 于 1989 年 出 版 了 “X/Open Portability Guide" ( «X/Open 
移植 性 指南 》) 第 3 期 (XPG3) 。 

第 4 期 于 1992 年 出 版 ， 这 一 期 的 第 2 版 于 1994 年 出 版 。 这 个 最 终 版 本 
也 称 为 “Spec 1170”， 其 中 魔 数 1170 是 系统 接口 数 〈926 个 ) 、 头 文件 数 
(704) 和 命令 数 1740) 的 总 和 。 这 组 规范 的 最 终 名 字 是 “X/Open 
Single Unix Specification”(X/Open 单 一 Unix 规 范 ) ， 也 称 为 “Unix 95”. 

1997 年 3 月 单一 Unix 规 范 的 第 2 版 发 表 。 符 合 这 个 规范 的 产品 可 称 
为 “Unix 98”， 这 也 是 本 书 提 到 这 个 规范 所 用 的 名 称 。Unix 98 所 需 的 接 
口 数 从 1170 个 增加 到 1434 个 ， 然 而 ， 适 用 于 工作 站 的 接口 数 却 猛 增 到 
3030 个 ， 因 为 它 包 含 CDE (ARMA, Common Desktop 
Environment) ， 而 CDE 又 反 过 来 要 求 有 X Windows 系 统 和 Motif 用 户 接 
口 。 其 详情 见 [Josey 1997] 和 http: //www.UNIX- 
systems.org/version2 。 

单一 Unix 规 范 的 许多 文档 可 在 因特网 上 从 这 个 站 点 免费 取得 。 

1.7.3 Unix 版 本 和 移植 性 

当今 大 多 数 Unix 系 统 符合 Posix.1 和 Posix.2 的 某 个 版 本 。 我 们 使 用 限 








定 词 “ 某 个 ”是 因为 Posix 每 次 更 新 (例如 1993 年 增加 实时 扩展 ，1996 年 增 
加 Pthreads 内 容 ) ， 广 家 都 得 花 一 两 年 〈 甚 至 更 长 的 时 间 ) 去 实现 并 加 
入 最 近 的 更 新 内 容 。 

从 历史 上 看 ， 多 数 Unix 系 统 或 者 源 目 Berkeley， 或 者 源 自 System 
V， 不 过 这 些 差 别 在 慢 慢 消失 ， 因 为 大 多 数 厂家 已 开始 采用 Posix 标 准 。 
仍然 存在 的 主要 差别 在 于 系统 管理 ， 这 是 一 个 目前 还 没有 任何 Posix 标 
准 可 循 的 领域 。 

运行 本 书 中 大 多 数 例 子 的 平台 是 Solaris 2.6 和 Digital Unix 4.0B。 其 
原因 在 于 写 到 此 处 时 〈1997 年 末 到 1998 年 初 ) ， 只 有 这 两 种 Unix 系 统 支 
持 System V IPC、Posix IPC 及 Posix 线 程 。 





1.8 E HIPC# 


为 分 析 各 种 特性 ， 全 书 主要 使 用 了 三 种 交互 模式 。 

(1) 文 件 服务 器 : 客户 -服务 器 应 用 程序 ， 客 户 同 服务 器 发 送 一 个 路 
径 名 ， 服 务 器 把 该 文件 的 内 容 返 回 给 客户 。 

(2) 生 产 者 -消费 者 : 一 个 或 多 个 线程 或 进程 〈 生 产 者 ) 把 数据 放 到 
一 个 共享 缓冲 区 中 ， 另 有 一 个 或 多 个 线程 或 进程 (消费 者 ) 对 该 共享 组 
冲 区 中 的 数据 进行 操作 。 

(3) 序 列 号 持续 增 1: 一 个 或 多 个 线程 或 进程 给 一 个 共享 的 序列 号 持 
续 增 1。 该 序列 号 有 时 在 一 个 共享 文件 中 ， 有 时 在 共享 内 存 区 中 。 

第 一 个 例子 分 析 各 种 形式 的 消息 传递 ， 另 外 两 个 例子 则 分 析 各 种 类 
型 的 同步 和 共享 内 存 区 

为 了 提供 本 书 所 涵盖 的 不 同 主题 的 索引 ， 图 1.9、 图 1.10 和 图 LL11 江 
总 了 我 们 开发 的 程序 及 它们 的 源 代 码 所 在 的 起 始 图 号 和 页 码 。 








使 用 两 个 管道 ， 父 子 进 程 间 

使 用 popen 和 cat 

使 用 两 个 FIFO， 父 子 进程 间 

使 用 两 个 FIFO， 独 立 的 服务 器 ， 与 服务 器 无 亲缘 关系 的 客户 


使 用 多 个 FIFO， 独 立 的 迭代 服务 器 ， 多 个 客户 
使 用 管道 或 FIFO: 在 字 节 流 上 构筑 记录 
使 用 两 个 System V 消 息 队 列 
使 用 一 个 System V 消 息 队 列 ， 多 个 客户 
每 个 客户 使 用 一 个 System V 消 息 队列 ， 多 个 客户 
使 用 穿越 门 的 描述 符 传 递 

图 1-9 不 同 版 本 的 文件 服务 器 客户 -服务 器 例子 





只 用 互 斥 锁 ， 多 个 生产 者 ， 单 个 消费 者 
互 斥 锁 和 条 件 变量 ， 多 个 生产 者 ， 单 个 消费 者 
Posix 有 名 信号 量 ， 单 个 生产 者 ， 单 个 消费 者 


Posix 基 于 内 存 的 信号 量 ， 单 个 生产 者 ， 单 个 消费 者 

Posix 基 于 内 存 的 信号 量 ， 多 个 生产 者 ， 单 个 消费 者 

Posix 基 于 内 存 的 信号 量 ， 多 个 生产 者 ， 多 个 消费 者 

Posix 基 于 内 存 的 信号 量 ， 单 个 生产 者 ， 单 个 消费 者 ， 多 个 缓冲 区 
图 1-10 不 同 版 本 的 生产 者 -消费 者 例子 





序列 号 在 文件 中 ， 不 上 锁 

序列 号 在 文件 中 ，fcnt1l1 上 锁 

序列 号 在 文件 中 ， 使 用 open 进 行文 件 系统 上 锁 

序列 号 在 文件 中 ，Posix 有 名 信和 号 量 上 锁 

序列 号 在 mmap 共 享 内 存 区 ，Posix 有 名 信和 号 量 上 锁 

序列 号 在 mmap 共 享 内 存 区 ，Posix 基 于 内 存 的 信号 量 上 锁 
序列 号 在 4.4BSD 匿 名 共享 内 存 区 ，Posix 有 名 信和 号 量 上 锁 


序列 号 在 SVR4/daev/zetro 共 享 内 存 区 ，Posix 有 名 信和 号 量 上 锁 
序列 号 在 Posix 共 享 内 存 区 ，Posix 基 于 内 存 的 信号 量 上 锁 
性 能 测量 : 线程 间 互 斥 锁 上 锁 


性 能 测 ; 
性 能 测量 
性 能 测量 
性 能 测量 
性 能 测量 
性 能 测 


t 线程 间 读 写 锁 上 锁 

t: 线程 间 Posix 基 于 内 存 的 信号 量 上 锁 
t 线程 间 Posix 有 名 信号 量 上 锁 

t. 线程 间 System V 信 和 号 量 上 锁 

u 线程 间 fcnt1 记 录 上 锁 

t: 线程 间 互 斥 锁 上 锁 

图 1-11 不 同 版 本 的 序列 号 持续 增 1 例 子 


1.9 2 


z * z 


z * 





mi 


IPC 传 统 上 是 Unix 中 一 个 杂乱 不 堪 的 领域 。 昌 然 有 了 各 种 各 样 的 解 


决 办 法 ， 但 没有 一 个 是 完美 的 。 我 们 的 讨论 分 成 4 个 主要 领域 : 


(1) 消 息 传递 〈 管 道 、FIFO、 消 息 队 列 ) ; 

(2) 同 步 〈“ 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 信 和 号 量 ) ; 

(3) 共 享 内 存 区 匿名 共享 内 存 区 、 有 名 共享 内 存 区 ) 5 
(4) 过 程 调用 CSolarisl]. Sun RPC) 。 

我 们 考虑 单个 进程 中 多 个 线程 间 的 IPC 以 及 多 个 进程 间 的 IPC。 

各 种 类 型 IPC 的 持续 性 可 以 是 随 进程 持续 的 、 随 内 核 持 续 的 或 随 文 





件 系 统 持续 的 ， 这 取决 于 IPC 对 象 存在 时 间 的 长 短 。 在 为 给 定 的 应 用 选 
择 所 用 的 IPC 类 型 时 ， 我 们 必须 清楚 相应 IPC 对 象 的 持续 性 。 

各 种 类 型 IPC 的 男 一 个 特性 是 名 字 空 间 ， 也 就 是 使 用 IPC 对 象 的 进程 
和 线程 标识 各 个 IPC 对 象 的 方式 。 各 种 类 型 的 IPC 有 些 没有 名 字 ( 管 道 、 
互 斥 锁 、 条 件 变 量 、 读 写 锁 ) ， 有 些 具 有 在 文件 系统 中 的 名 字 
(FIFO) ， 有 些 具 有 将 在 第 2 章 中 讲述 的 Posix IPC 名 字 ， 有 些 则 具有 其 
他 类 型 的 名 字 〈 将 在 第 3 章 中 讲述 的 System V IPC 键 或 标识 符 ) 。 典 型 
做 法 是 : 服务 器 以 某 个 名 字 创 建 一 个 IPC 对 象 ， 客 户 则 使 用 该 名 字 访 问 
同一 个 IPC 对 象 。 

本 书 中 所 有 源 代码 使 用 1.6 节 中 讲述 的 包 里 函数 来 缩短 篇 幅 ， 同 时 
达到 检查 每 个 函数 调用 是 否 返 回 错误 的 目的 。 我 们 的 包 于 函 数 都 以 一 个 
大 写字 母 开 头 。 

IEEE Posix 标 准 一 直 是 多 数 广 家 努力 遵循 的 标准 ， 其 中 Posix.1 定 义 
了 访问 Unix 的 基本 C 接 口 ，Posix.2 定 义 了 标准 命令 。 然 而 商业 标准 也 在 
迅速 地 吸纳 并 扩展 Posix 标 准 ， 闭 名 的 有 Open ”Group 的 Unix 标 准 ， 例 如 
Unix 98。 


























习题 


1.1 图 1-1 中 我 们 展示 了 两 个 进程 访问 单个 文件 的 情形 。 如 果 这 两 个 
进程 都 只 是 往 该 文件 的 末尾 添加 新 的 数据 ( 壁 如 说 这 是 一 个 日 志文 
TE) ， 那 么 需要 什么 类 型 的 同步 ? 

1.2 查看 一 下 你 的 系统 中 的 <error.h> 头 文件 是 如 何 定义 errno 变 量 
的 。 

1.3 在 图 1-5 上 标注 出 你 使 用 的 Unix 系 统 所 文 持 的 特性 。 


第 2 章 Posix IPC 
2.1 概述 


以 下 三 种 类 型 的 IPC 合 称 为 “Posix IPC": 

Posix 消 息 队 列 〈 第 5 章 ) ; 

Posix 信 号 量 〈 第 10 章 ) ; 

Posix 共 享 内 存 区 《第 13 章 ) 。 

Posix IPC 在 访问 它们 的 函数 和 摘 述 它们 的 信息 上 有 一 些 类 似 点 。 本 
章 讲 述 所 有 这 些 共同 属性 : 用 于 标识 的 路 径 名 、 打 开 或 创建 时 指定 的 标 


志 以 及 访问 权限 。 
图 2-1 汇 总 了 所 有 Posix IPCER RX. 


| We J 
xxm 


ITIER - PC fh og mq open sem open shm open 
创建 、 打 开 或 删除 IPC 的 函数 mq close sem close shm unlink 
mq unlink sem unlink 








sem init 
sem destroy 
| mq getattr ftruncate 
teed Estat 


mq_send sem_wait mmap 
IPCHRTE PAB mq receive | sem trywait munmap 
mq notify sem post 
sem getvalue 


图 2-1 Posix IPCER ZI M 





2.2 PC 和 名字 
在 图 1-4 中 我 们 指出 ， 三 种 类 型 的 Posix ”IPC 都 使 用 “Posix IPC% 





字 ” 进 行 标识 。mq_open、sem_open 和 shm_open 这 三 个 函数 的 第 一 个 参 
数 束 是 这 样 的 一 个 名 字 ， 它 可 能 是 某 个 文件 系统 中 的 一 个 真正 的 路 答 
名 ， 也 可 能 不 是 。Posix.1 是 这 么 描述 Posix IPC 名 字 的 。 

它 必 须 符合 已 有 的 路 径 名 规则 《必须 最 多 由 PATH_MAX 个 字 节 构 
成 ， 包 括 结尾 的 空 字 节 ) 。 

如 果 它 以 斜 枉 符 开头 ， 那 么 对 这 些 函 数 的 不 同调 用 将 访问 同一 个 队 
列 。 如 果 它 不 以 斜 杠 符 开 头 ， 那 么 效果 取决 于 实现 。 

名 字 中 额外 的 斜 杠 符 的 解释 由 实现 定义 。 

因此 ， 为 便于 移植 起 见 ，Posix IPC 名 字 必 须 以 一 个 斜 杠 符 打头 ， 并 
旦 不 能 再 含有 任何 其 他 和 斜 杠 符 。 遗 憾 的 是 这 些 规则 还 不 够 ， 仍 会 出 现 移 
植 性 问题 。 

Solaris “2.6 要 求 有 打头 的 斜 枉 符 ， 但 是 不 允许 有 另外 的 笠 杠 符 。 假 
设 要 创建 的 是 一 个 消息 队列 ， 创 建 函 数 将 在 /tmp 中 创建 三 个 以 .MQ 开头 
的 文件 。 例 如 ， 如 果 给 mq_open 的 参数 为 /queue.1234， 那 么 这 三 个 文件 
分 别 为 /tmp/.MQDgqueue.1234、/tmp/.MQLgueue.1234 
和 /tmp/.MQPqueue.1234。Digita.Uni.4.0B 则 在 文件 系统 中 创建 所 指定 的 
路 径 名 。 

当 我 们 指定 一 个 只 有 单个 斜 杠 符 〈 作 为 首 字 符 ) 的 名 字 时 ， 移 植 性 
MAE YT: 我 们 必须 在 根 目 录 中 具有 写 权 限 。 例 如 ，/tmp.1234 符 合 
Posix 规 则 ， 在 Solaris 下 也 可 行 ， 但 是 Digital ”Unix 却 会 试图 创建 这 个 文 
件 ， 这 时 除非 我 们 有 在 根 目 录 中 的 写 权 限 ， 否 则 这 样 的 尝试 将 失败 。 如 
果 我 们 指定 一 个 /tmp/test.1234 这 样 的 名 字 ， 那 么 在 以 该 名 字 创 建 一 个 真 
正文 件 的 所 有 系统 上 都 将 成 功 《〈 前 提 是 /mp 目录 存在 ， 而 且 我 们 在 该 目 
录 中 有 写 权 限 ， 对 于 多 数 Unix 系 统 来 说 ， 这 是 正音 情况 ) ， 在 Solaris 下 
则 失败 。 

为 避免 这 些 移植 性 问题 ， 我 们 应 该 把 Posix IPC 名 字 的 #define 行 放 在 
一 个 便于 修改 的 头 文 件 中 ， 这 样 应 用 程序 转移 到 另 一 个 系统 上 时 ， 只 需 



































修改 这 个 头 文 件 。 

这 是 一 个 标准 试图 变 得 相当 通用 (本 例子 中 ， 实 时 标准 试图 允许 消 
恩 队 列 、 信 号 量 和 共享 内 存 区 都 在 现 有 的 Unix 内 核 中 实现 ， 而 且 在 独立 
的 无 盘 系 统 上 也 能 工作 ) ， 结 果 标 准 的 具体 实现 却 变 得 不 可 移植 的 个 例 
之 一 。 在 Posix 中 ， 这 种 现象 称 为 “造成 不 标准 的 标准 方式 ”(a standard 
way of being nonstandard) 。 

Posix.1 定 义 了 三 个 安 : 

S TYPEISMQ(buf) 

S TYPEISSEM(buf) 

S TYPEISSHM(buf) 

"t TES EA BUE TR IR A starz eet, FLA Hfstat. Istatek 
stat 这 三 个 函数 填 入 。 如 果 所 指定 的 IPC 对 象 〈 消 息 队 列 、 信 和 号 量 或 共享 
内 存 区 对 象 》 是 作为 一 种 独特 的 文件 类 型 实现 的 ， 而 且 参 数 所 指 问 的 
stat 结 构 访 问 这 样 的 文件 类 型 ， 那 么 这 三 个 宏 计 算出 一 个 非 零 值 。 否 
则 ， 计 算出 的 值 为 0。 

不 幸 的 是 ， 这 三 个 宏 没 有 多 大 用 处 ， 因 为 无 法 保证 这 三 种 类 型 的 
IPC 使 用 一 种 独特 的 文件 类 型 实现 。 举 例 来 说 ， 在 Solaris 2.6 下 ， 这 三 个 
宏 的 计算 结果 总 是 0。 

测试 某 个 文件 是 否 为 给 定 文件 类 型 的 所 有 其 他 宏 的 名 字 都 以 S_IS 开 
头 ， 而 且 它 们 的 单个 参数 是 某 个 stat 结 构 的 st_mode 成 员 。 由 于 上 面 三 个 
新 宏 的 参数 不 同 于 其 他 宏 ， 因 此 它们 的 名 字 改 为 以 S_ TYPEIS 开 头 。 

px ipc namer& 2 

解决 上 述 移 植 性 问题 的 男 一 种 办 法 是 自己 定义 一 个 名 为 
px_ipc_name 的 水 数 ， 它 为 定位 Posix IPC 名 字 而 添加 上 正确 的 前 级 目 
Ke 


#include "unpipc.h" 























char *px_ipc_name(const char *name); 


均 返 回 : 大 成 功 则 为 非 空 指 针 ， 辱 出 错 则 为 NULL 

本 书 中 我 们 给 自己 定义 的 非 标准 系统 函数 都 使 用 这 样 的 版 式 : 围绕 
函数 原型 和 返回 值 的 方 框 是 虚 框 。 开 头 包 含 的 头 文件 通常 是 我 们 的 
unpipc.h (AIC-l 。 

name 人 参数 中 不 能 有 任何 斜 枉 符 。 例 如 ， 调 用 

px_ipc_name("test1") 

在 Solaris ”2.6 下 返回 一 个 指 辣 字符 串 /testl 的 指针 ， 在 Digital Unix 
4.0B 下 返回 一 个 指向 字符 串 /tmp/test1 的 指针 。 存 放 结 果 字 符 串 的 内 存 空 
间 是 动态 分 配 的 ， 并 可 通过 调用 free 释 放 。 另 外 ， 环 境 变 量 
PX_IPC_NAME 能 够 覆盖 默认 目录 。 

图 2-2 给 出 了 该 函数 的 实现 。 





lib/px ipc name.c 





1 #include "unpipc.h" 
2 char * 
3 px ipc name(const char *name) 
4 { 
5 char *dir, *dst, *slash; 
6 if ( (dst = malloc(PATH MAX)) == NULL) 
7 return (NULL) ; 
8 /* can override default directory with environment variable */ 
9 if ( (dir = getenv("PX IPC NAME")) == NULL) ( 
10 #ifdef POSIX IPC PREFIX 
11 dir - POSIX IPC PREFIX; /* from "config.h" */ 
12 #else 
13 dir - "/tmp/"; /* default */ 
14 #endif 
15 ) 
16 /* dir must end in a slash */ 
17 slash = (dir[strlen(dir) - 1] == '/') ? "" : "/"; 
18 snprintf(dst, PATH MAX, "$s$s$s", dir, slash, name); 
19 return (dst); /* caller can free() this pointer */ 
20 } 


lib/px ipc name.c 





图 2-2 我 们 的 px_ipc_name 函 数 


这 也 许 是 你 第 一 次 碰 到 snprintf 函 数 。 许 多 现 有 代码 调用 的 是 
sprintf， 但 是 sprintf 不 检查 目标 缓冲 区 是 否 溢出 ， 不 过 snprintf 要 求 其 第 


二 个 参数 是 目标 缓冲 区 的 大 小 ， 因 此 可 确保 缓冲 区 不 溢出 。 提 供 能 有 意 
溢出 一 个 程序 的 Sprintf 绥 冲 区 的 输入 数据 是 黑客 们 已 使 用 很 多 年 的 一 种 
攻破 系统 的 方法 。 

snprintf 不 是 标准 ANSI “C 的 一 部 分 ， 但 这 个 标准 的 修订 版 C9X 正 在 
考虑 。 [2] 不 过 ， 许 多 厂家 提供 的 标准 C 函 数 库 含有 这 个 函数 。 我 们 在 
本 书 中 使 用 snprintf， 如 采 你 的 系统 不 提供 这 个 函数 ， 那 就 使 用 我 们 上 自己 
的 通过 调用 sprintf 实 现 的 版 本 。 


2.3 创建 与 打开 IPC 通 道 


mdq_open、sem_open 和 shm_open 这 三 个 创建 或 打开 一 个 IPC 对 象 的 
函数 ， 它 们 的 名 为 oflag 的 第 二 个 参数 指定 怎样 打开 所 请 求 的 对 象 。 这 与 
标准 open 函 数 的 第 二 个 参数 类 似 。 图 2-3 给 出 了 可 组 合 构成 该 参数 的 各 


种 党 值 。 
前 3 行 指定 怎样 打开 对 象 : 只 读 、 只 写 或 读 写 。 消 息 队 列 能 以 其 中 








任何 一 种 模式 打开 ， 信 和 号 量 的 打开 不 指定 任何 模式 《任意 信号 量 操作 ， 
都 需要 读 写 访问 权 ) ， 共 享 内 存 区 对 象 则 不 能 以 只 写 模式 打开 。 


| mns [orpony | | [ompwx | RDONLY O RDONLY 
O WRONLY 
O RDWR O RDWR 


若 不 存在 则 创建 ”| O CREAT O_CREAT O_CREAT 
非 阻塞 模式 0 NONREOCK 


图 2-3 打开 或 创建 Posix IPC 对 象 所 用 的 各 种 oflag 常 值 











图 2-3 中 余下 4 行 标 志 是 可 选 的 。 

O CREAT 大 不 存在 则 创建 由 函数 第 一 个 参数 所 指定 名 字 的 消息 队 
列 、 信 和 号 量 或 共享 内 存 区 对 象 〈 同 时 检查 O_EXCL 标 志 ， 我 们 不 久 将 要 
说 明 ) 。 

创建 一 个 新 的 消息 队列 、 信 号 量 或 共享 内 存 区 对 象 时 ， 至 少 需要 另 
外 一 个 称 为 mode 的 参数 。 该 参数 指定 权限 位 ， 它 是 由 图 2-4 中 所 示 常 值 
按 位 或 形成 的 。 


S IRUSR HP ORO 读 
a nens 用 户 ( 属 主 ) 写 























ud 组 成 员 读 
S IWGRP 组 成 bì = 
ne 其 他 用 户 读 


S_IWOTH 其 他 用 户 写 


图 2-4 创建 新 的 IPC 对 象 所 用 的 mode 常 值 











这 些 和 常 值 定 义 在 <sys/stat.h> 头 文件 中 。 所 指定 的 权限 位 受 当 前 进程 
的 文件 模式 创建 掩 码 (file mode creation mask) 修正 ， 而 该 掩 码 可 通过 
调用 umask 函 数 (APUE 第 83 一 85 页 [3] ) 或 使 用 shell 的 umask 命 令 来 设 
置 。 

跟 新 创建 的 文件 一 样 ， 当 创建 一 个 新 的 消息 队列 、 信 和 号 量 或 共享 内 
存 区 对 象 时 ， 其 用 户 ID 被 置 为 当前 进程 的 有 效用 户 ID。 信 和 号 量 或 共享 内 
存 区 对 象 的 组 ID 被 置 为 当前 进程 的 有 效 组 ID 或 某 个 系统 默认 组 ID。 新 消 
娠 队列 对 象 的 组 DD 则 被 置 为 当前 进程 的 有 效 组 ID (APUE 第 77 一 78 页 [4] 
详细 讨论 了 用 户 ID 和 组 JD。) 














这 三 种 Posix ”IPC 类 型 在 设置 组 ID 上 存在 的 差异 多 少 有 点 奇怪 。 由 
open 新 创建 的 文件 的 组 ID 或 者 是 当前 进程 的 有 效 组 ID， 或 者 是 该 文件 所 
在 目录 的 组 ID， 但 是 IPC 函 数 不 能 假定 系统 为 IPC 对 象 创建 了 一 个 在 文件 
系统 中 的 路 径 名 。 

O EXCL 如 果 该 标志 和 O_CREAT 一 起 指定 ， 那 么 IPC 函 数 只 在 所 指 
定名 字 的 消息 队列 、 信 和 号 量 或 共享 内 存 区 对 象 不 存在 时 才 创 建新 的 对 
象 。 如 采访 对象 已 经 存在 ， 而 且 指 定 了 O_CREATIO_EXCL， 那 么 返回 
一 个 EEXIST 错 误 。 

考虑 到 其 他 进程 的 存在 ， 检 查 所 指定 名 字 的 消息 队列 、 信 和 号 量 或 共 
享 内 存 区 

对 象 的 存在 与 否 和 创建 它 〈 如 果 它 不 存在 ) 这 两 步 必 须 是 原子 的 

Catomic) 。 

我 们 将 在 3.4 节 看 到 适用 于 System V IPC 的 两 个 类 似 标志 。 

O NONBLOCK 该 标志 使 得 一 个 消息 队列 在 队列 为 空 时 的 读 或 队列 
填 满 时 的 写 不 被 阻塞 。 我 们 将 在 5.4 节 随 mq_receive 和 mq_send 这 两 个 子 
数 详细 讨论 该 标志 。 

O TRUNC 如 果 以 读 写 模式 打开 了 一 个 已 存在 的 共享 内 存 区 对 象 ， 
那么 该 标志 将 使 得 该 对 象 的 长 度 被 截 成 0。 

图 2-5 展 示 了 打开 一 个 IPC 对 象 的 真正 逻辑 流程 。 我 们 将 在 2.4 节 通过 
访问 权限 的 测试 说 明 该 图 。 图 2-6 是 展示 图 2-5 中 逮 辑 的 另 一 种 形式 。 


























出 错 返 回 ， 
errno = ENOSPC 


新 对 象 被 创建 





出 错 返回 ， 


errno = ENOENT 







对 象 已 存在 ? 





出 错 返回 ， 
errno = EEXIST 





0O_CREAT 和 0O_EXCL 都 


设置 了 ? 





已 存在 对 象 被 引用 


出 错 返 回 ， 
errno = EACCES 





访问 权限 允许 ? 


M 


成 功 
图 2-5 打开 或 创建 一 个 IPC 对 象 的 逻辑 


对 象 不 存在 对 象 已 存在 


无 特殊 标志 IH, errno = ENOENT 成 功 ， 引 用 已 存在 对 象 


O_CREAT 成 功 ， 创 建新 对 象 成 功 ， 引 用 已 存在 对 象 
O CREAT | O EXCL 成 功 ， 创 建新 对 象 出 错 ，errno = EEXIST 





图 2-6 创建 或 打开 一 个 IPC 对 象 的 逻辑 

注意 图 2-6 指 定 了 O_CREAT 标 志 但 没有 指定 O_ Po ne 

行 ， 我 们 无 法 得 到 一 个 指示 以 判别 是 创建 了 一 个 新 对 象 ， 还 是 在 引用 一 
个 已 存在 的 对 象 。 














2.4 IPC 权 限 


新 的 消息 队列 、 有 多 信号 量 或 共享 内 存 区 对 象 是 由 其 oflag 参 数 中 含 
有 O_CREAT 标 志 的 mq_open、sem_open 或 shm_open 函 数 创 建 的 。 如 图 
2-4 所 示 ， 权 限 位 与 这 些 IPC 类 型 的 每 个 对 象 相关 联 ， 束 像 它们 与 每 个 














Unix 文 件 相 关联 一 样 。 

当 同 样 由 这 三 个 函数 打开 一 个 已 存在 的 消息 队列 、 信 和 号 量 或 共享 内 
存 区 对 象 时 (或 者 未 指定 O_CREAT， 或 者 指定 了 O_CREAT 但 没有 指定 
O_EXCL， 同 时 对 象 已 经 存在 ) ， 将 基于 如 下 信息 执行 权限 测试 : 

(1) 创 建 时 赋予 该 IPC 对 象 的 权限 位 ; 

(2) 所 请 求 的 访问 类 型 (O_ RDONLY、O_WRONLY 或 
O_RDWR) ; 

(3) 调 用 进程 的 有 效用 户 ID、 有 效 组 ID 以 及 各 个 辅助 组 ID CE 30 HF 
的 话 ) 。 

大 多 数 Unix 内 核 按 如 下 步骤 执行 权限 测试 。 

(1 如 果 当 前 进程 的 有 效用 户 ID 为 0〈 超 级 用 户 ) ， 那 就 允许 访问 。 

(2) 在 当前 进程 的 有 效用 户 ID 等 于 该 IPC 对 象 的 属 主 ID 的 前 提 下 ， 如 
果 相 应 的 用 户 访问 权限 位 已 设置 ， 那 就 允许 访问 ， 否 则 拒绝 访问 。 

这 里 相应 的 访问 权限 位 的 意思 是 : 如 果 当 前 进程 为 读 访 问 而 打开 该 
IPC 对 象 ， 那 么 用 户 读 权 限 位 必须 设置 ， 如 果 当 前 进程 为 写 访问 而 打开 
该 IPC 对 象 ， 那 么 用 户 写 权限 位 必须 设置 。 

(3) 在 当前 进程 的 有 效 组 ID 或 它 的 某 个 辅助 组 ID 等 于 该 IPC 对 和 象 的 组 
ID 的 前 提 下 ， 如 果 相 应 的 组 访问 权限 位 已 设置 ， 那 就 允许 访问 ， 否 则 拒 
绝 访问 。 

(4) 如 果 相 应 的 其 他 用 户 访问 权限 位 已 设置 ， 那 就 允许 访问 ， 否 则 拒 
绝 访问 。 

这 4 个 步骤 是 按 所 列 的 顺序 尝试 的 。 因 此 ， 如 果 当 前 进程 拥有 该 IPC 
对 象 〈 第 2 步 ) ， 那 么 访问 权 的 授予 与 拒绝 只 依赖 于 用 户 访问 权限 一 一 
组 访问 权限 绝 不 会 考虑 。 类 似 地 ， 如 果 当 前 进程 不 拥有 该 IPC 对 象 ， 但 
它 属 于 某 个 合适 的 组 ， 那 么 访问 权 的 授予 与 拒绝 只 依赖 于 组 访问 权限 
一 一 其 他 用 户 访问 权限 绝 不 会 考虑 。 

我 们 从 图 2-3 中 指出 ，sem_open 不 使 用 O_RDONLY、O_WRONLY 























或 O RDWR 标 志 。 然 而 在 10.2 节 我 们 将 指出 ， 某 些 Unix 实 现 采 用 


O_RDWR， 因 为 只 要 使 用 一 个 信号 量 ， 都 涉及 读 写 该 信号 量 的 值 。 
2.5 小 结 


三 种 类 型 的 Posix IPC 一 一 消息 队列 、 信 号 量 、 共 享 内 存 区 一 一 都 是 
用 路 径 名 标识 的 。 但 是 这 些 路 径 名 既 可 以 是 文件 系统 中 的 实际 路 径 名 ， 
也 可 以 不 是 ， 而 这 点 不 一 致 性 会 导致 一 个 移植 性 问题 。 全 书 采 用 的 解决 
办 法 是 使 用 我 们 目 己 的 px_ipc_name 函 数 。 

当 创 建 或 打开 一 个 IPC 对 象 时 ， 我 们 指定 一 组 类 似 于 open 函 数 所 用 
的 标志 。 创 建 一 个 新 的 PC 对象 时 ， 我 们 必须 给 这 个 新 对 象 指定 访问 权 
限 ， 所 用 的 是 同样 由 open 函 数 使 用 的 S_xxx 常 值 〈 见 图 2-4) 。 当 打开 一 
个 已 存在 的 IPC 对 象 时 ， 所 执行 的 权限 测试 与 打开 一 个 已 存在 的 文件 时 
一 样 。 

















习题 


2.1 使 用 Posix IPC 的 程序 ， 其 SUID 与 SGID 位 (APUE 的 4.4 节 ) 是 如 
何 影响 2.4 节 中 所 述 的 权限 测试 的 ? 

2.2 当 一 个 程序 打开 一 个 Posix IPC 对 象 时 ， 它 怎样 才能 判定 是 创建 
了 一 个 新 对 象 还 是 在 引用 一 个 已 有 的 对 象 ? 





第 3 章 System V IPC 
3.1 概述 


以 下 三 种 类 型 的 IPC 合 称 为 System V IPC: 

System V 消 县 队列 《第 6 章 ) ; 

System V 信 号 量 〈 第 11 章 ) ; 

System VO 共享 内 存 区 (第 14 章 〉。 

这 个 称谓 作为 这 三 种 IPC 机 制 的 通称 是 因为 它们 源 目 System V 

Unix. System V IPC 在 访问 它们 的 函数 和 内 核 为 它们 维护 的 信息 上 享有 
许多 类 似 点 。 本 章 讲 述 所 有 这 些 共同 属性 。 

图 3-1 汇 总 了 所 有 System V IPC 函 数 。 








一 
TECN 


Td meal | semctl | 
msgrcv shmdt 
图 3-1 System V IPC% 
System V IPC 疯 数 的 设计 与 开发 信息 难以 找到 。 [Rochkind 1985 | 

提供 了 下 述 信息 : System V 消 恩 队 列 、 信 号 量 和 共 至 内 存 区 是 20 世 纪 70 
年 代 后 期 在 俄 辫 俄 州 哥伦布 市 的 一 个 贝尔 实验 室 分 支 机 构 开 发 的 ， 他 们 
开发 了 一 个 内 部 Unix 版 本 ， “顺理成章 地 ) 称 为 “Columbus Unix” 或 简 
称 "“CB — Unix". CB ”Unix 用 于 “操作 文 持 系统 ”(Operation Support 
System) ， 即 上 自动 完成 电话 公司 的 管理 和 记录 保存 工作 的 事务 处 理 系 











统 。System V IPC 大 约 于 1983 年 随 System V 加 入 到 商用 Unix 系 统 中 。 


3.2 key_t 键 和 ftok 函 数 


图 1-4 中 注 明 ， 三 种 类 型 的 System V IPC 使 用 key_t 值 作为 它们 的 名 
字 。 头 文件 <sys/types.h> 把 key_t 这 个 数据 类 型 定义 为 一 个 整数 ， 它 通 负 
是 一 个 至 少 32 位 的 整数 。 这 些 整 数值 通常 是 由 ftok 函 数 赋予 的 。 

函数 ftok 把 一 个 已 存在 的 路 径 名 和 一 个 整数 标识 符 转换 成 一 个 key_t 
值 ， 称 为 IPC 键 。 

#include <sys/ipc.h> 

key. t ftok(const char *pathname, int id); 

返回 : 若 成 功 则 为 IPC 键 ， 若 出 错 则 为 -1 

该 函数 把 从 pathname 守 出 的 信息 与 id 的 低 序 8 位 组 合成 一 个 整数 IPC 
键 。 

该 函数 假定 对 于 使 用 System V IPC 的 某 个 给 定 应 用 来 说 ， 客 户 和 服 
务 器 同意 使 用 对 该 应 用 有 一 定 意 义 的 pathname。 它 可 以 是 服务 器 守护 程 
序 的 路 径 名 、 服 务 器 使 用 的 茶 个 公共 数据 文件 的 路 径 名 或 者 系统 上 的 某 
个 其 他 路 径 名 。 如 果 客 户 和 服务 器 之 间 只 需 单个 IPC 通 道 ， 那 么 可 以 使 
用 壁 如 说 值 为 1 的 d。 如 果 需 要 多 个 IPC 通 道 ， 壁 如 说 从 客户 到 服务 器 
个 通道 ， 从 服务 器 到 客户 又 一 个 通道 ， 那 么 作为 一 个 例子 ， 一 个 通道 可 
使 用 值 为 1 的 id， 另 一 个 通道 可 使 用 值 为 2 的 这 。 客 户 和 服务 器 一 旦 在 
pathname 和 id 上 达成 一 致 ， 双 方 就 都 能 调用 ftok 函 数 把 pathname 和 id 转换 
成 同一 个 IPC 键 。 

ftok 的 典型 实现 调用 stat 函 数 ， 然 后 组 合 以 下 三 个 值 。 

(1)pathname 所 在 的 文件 系统 的 信息 〈stat 结 构 的 st_dev 成 员 ) o 

(2) 该 文件 在 本 文件 系统 内 的 索引 布点 号 《〈stat 结 构 的 st_ino 成 员 ) 

(3)id 的 低 序 8 位 不 能 为 0; 。 [5] 








这 三 个 值 的 组 合 通常 会 产生 一 个 32 位 键 。 不 能 保证 两 个 不 同 的 路 径 
名 与 同一 个 id 的 组 合 产生 不 同 的 键 ， 因 为 上 面 所 列 三 个 条 目 《 文 件 系 统 
标识 符 、 索 引 节点 、id) 中 的 信息 位 数 可 能 大 于 一 个 整数 的 信息 位 数 
(见习 题 3.5) 。 

索引 节点 绝 不 会 是 9， 因此 大 多 数 实现 把 IPC_PRIVATE 将 在 3.4 市 
讲述 ) 定义 为 0。 

如 果 pathname 不 存在 ， 或 者 对 于 调用 进程 不 可 访问 ，ftok 就 返回 
-1。 注 意 ， 路 径 名 用 于 产生 键 的 文件 不 能 是 在 服务 器 存活 期 间 由 服务 器 
反复 创建 并 删除 的 文件 ， 因 为 该 文件 每 次 创建 时 由 系统 赋予 的 索引 节点 
号 很 可 能 不 一 样 ， 于 是 对 下 一 个 调用 者 来 说 ， 由 ftok 返 回 的 键 也 可 能 不 
同 。 

例子 

图 3-2 中 的 程序 取 一 个 作为 命令 行 参数 的 路 径 名 ， 调 用 stat， 调 用 
ftok， 然 后 输出 stat 结 构 的 st_dev 和 st_ino 成 员 以 及 得 出 的 IPC 键 。 这 三 个 
值 是 以 十 六 进 制 输 出 的 ， 这 样 我 们 可 从 这 两 个 值 以 及 id 值 0x57 很 容易 地 
看 出 了 PC 键 是 如 何 构造 的 。 











svipc/ftok.c 
1 #include "unpipc.h" 
2; int 
3 main(int argc, char **argv) 
d 
5 struct stat stat; 
6 if (argc !- 2) 
7 err quit("usage: ftok <pathname>") ; 
8 Stat (argv[1], &stat) ; 
9 printf ("st_dev: $1x, st ino: %lx, key: %x\n", 
10 (u_long) stat.st_dev, (u_long) stat.st_ino, 
alah Ftok(argv[1], 0x57)); 
12 exit (0); 
13. } 
svipc/ftok.c 














图 3-2 获取 并 输出 文件 系统 信息 和 IPC 键 
在 Solaris 2.6 下 执行 该 程序 的 结果 如 下 : 


solaris % ftok /etc/system 


st_dev: 800018,st_ino: 4a1b,key: 57018a1b 

solaris % ftok /usr/tmp 

st_dev: 800015,st_ino: 10b78,key: 57015b78 

solaris % ftok /home/rstevens/Mail.out 

st_dev: 80001f,st_ino: 3b03,key: 5701fb03 

很 明显 ，id 在 IPC 键 的 高 序 8 位 ，st_dev 的 低 序 12 位 IPC 在 键 的 接 下 来 
12 位 ，st_ino 的 低 序 12 位 则 在 IPC 键 的 低 序 12 位 。 

我 们 展示 本 例子 的 目的 不 是 让 大 家 依据 这 种 信息 组 合 方式 构造 出 
IPC 键 ， 而 是 让 大 家 看 看 一 个 实现 是 如 何 组 合 pathname 和 id 的 。 其 他 实 
现 可 能 以 不 同 的 方式 组 合 。 

FreeBSD 使 用 id 的 低 8 位 、st_dev 的 低 8 位 以 及 st_ino 的 低 16 位 。 

注意 由 ftok 完 成 的 映射 是 单 同 的 ， 因 为 st_dev 和 st_ino 中 某 些 位 未 被 
使 用 。 这 束 是 说 ， 我 们 不 能 从 一 个 给 定 的 键 确 定 创建 它 时 所 用 的 路 径 
名 。 











3.3 ipc perm ý 


内 核 给 每 个 IPC 对 象 维护 一 个 信息 结构 ， 其 内 容 跟 内 核 给 文件 维护 
的 信息 类 似 。 
struct ipc_perm { 
uid_t uid; /* owner's user id */ 
gid t gid; /* owner's group id */ 
uid t cuid; /* creator's user id */ 
gid t cgid; /* creator's group id */ 
mode t mode; /* read-write permissions */ 
ulong t seq; /* slot usage sequence number */ 
key t key; /* [PC key */ 


二 
该 结构 以 及 System V — IPC 函 数 使 用 的 较为 明显 的 常 值 定 义 在 


<Ssys/ipc.h> 头 文件 中 。 我 们 将 在 本 章 讨论 该 结构 的 所 有 成 员 。 
3.4 创建 与 打开 IPC 通 道 


创建 或 打开 一 个 IPC 对 象 的 三 个 getXXX 函 数 〈 见 图 3-1) 的 第 一 个 
参数 key 是 类 型 为 key_t 的 IPC 键 ， 返 回 值 identifier 是 一 个 整数 标识 符 。 该 
标识 符 不 同 于 ftok 函 数 的 id 参 数 ， 我 们 不 久 就 会 看 到 。 对 于 key 值 ， 应 用 
程序 有 两 种 选择 。 

(1) 调 用 ftok， 给 它 传递 pathname 和 id。 

(2) 指 定 key 为 IPC_PRIVATE， 这 将 保证 会 创建 一 个 新 的 、 唯 一 的 
IPC 对 象 。 

图 3-3 展 示 有 关 步 又 的 顺序 。 












* pathname 






int id 






msgcgl () , msgsnd () , msgrcv () 
semctl(),semop() 
shmct1() , shmat () , shmdt () 






int identifier 





key)JIPC PREVATE 






打开 或 创建 访问 IPC 通 道 
IPC 通 道 


图 3-3 从 IPC 键 生成 IPC 标 识 符 





所 有 三 个 getXXX 函 数 〈 见 图 3-1) 都 有 一 个 名 为 oflag 的 参数 ， 它 指 
定 IPC 对 象 的 读 写 权限 位 〈ipc_perm 结 构 的 mode 成 员 ) ， 并 选择 是 创建 
一 个 新 的 IPC 对 象 还 是 访问 一 个 已 存在 的 IPC 对 象 。 这 种 选择 的 规则 如 
TF. 

指定 key 为 IPC_PRIVATE 能 保证 创建 一 个 唯一 的 IPC 对 象 。 没 有 一 
对 id 和 pathname 的 组 合 会 导致 ftok 产 生 IPC_PRIVATE 这 个 键 值 。 

设置 oflag 参 数 的 IPC_CREAT 位 但 不 设置 它 的 IPC_EXCL 位 时 ， 如 果 
所 指定 键 的 IPC 对 象 不 存在 ， 那 就 创建 一 个 新 的 对 象 ， 否 则 返回 该 对 


象 。 

同时 设置 oflag 的 IPC_CREAT 和 IPC_EXCL 位 时 ， 如 果 所 指定 键 的 
IPC 对 象 不 存在 ， 那 就 创建 一 个 新 的 对 象 ， 否 则 返回 一 个 EEXIST 错 误 ， 
因为 该 对 象 已 存在 。 

对 IPC 对 象 来 说 ，IPC_CREAT 和 IPC_EXCL 的 组 合 跟 open 函 数 的 
O_CREAT 和 O_EXCL 的 组 合 类 似 。 

设置 IPC_EXCL 位 但 不 设置 IPC_CREAT 位 是 没有 意义 的 。 

图 3-4 展 示 了 打开 一 个 IPC 对 象 的 逻辑 流程 。 图 3-5 是 展示 图 3-4 所 未 
逻辑 的 男 一 种 形式 。 








成 功 ， 创 建 了 新 对 象 ， 
起 始 位 置 返回 标识 符 


key==IPC_PRIVATE? = 


key 已 经 存在 ? 





出 错 返 回 ， 
errno = ENOSPC 





新 对 象 被 创建 


pu 







出 错 返回 ， 


errno = ENOENT 


^ 
IPC CREATE J? 


出 错 返 回 ， 


errno = EEXIST 












IPC_CREAT 和 


IPC_EXCL 都 设置 了 ? 


已 存在 对 象 被 引用 
出 错 返回 ， 


errno = EACCES 


成 功 ， 返 回 标识 符 
图 3-4 创建 或 打开 一 个 IPC 对 象 的 逻辑 





无 特殊 标志 Hifi, errno = ENOENT 成 功 ， 引 用 已 存在 对 象 


IPC_CREAT 成 功 ， 创 建新 对 象 成 功 ， 引 用 已 存在 对 象 


IPC CREAT | IPC EXCL 成 功 ， 创 建新 对 象 出 错 ，errno = EEXIST 





图 3-5 创建 或 打开 一 个 IPC 通 道 的 逻辑 
注意 图 3-5 中 间 只 有 IPC_CREAT 而 没有 IPC_EXCL 标 志 的 那 一 行 ， 
我 们 得 不 到 一 个 指示 以 判别 是 创建 了 一 个 新 对 象 ， 还 是 在 引用 一 个 已 存 

在 的 对 象 。 大 多 数 应 用 程序 中 ， 由 服务 器 创建 IPC 对 象 并 指定 
IPC_CREAT 标 志 ( 如 果 它 不 关心 该 对 象 是 否 存在 ) 或 ITPC_CREAT | 
IPC_EXCL 标 志 【〈 如 果 它 需要 检查 该 对 象 是 否 已 经 存在 ) 。 客 户 则 不 指 
定 其 中 任何 一 个 标志 《它们 假定 服务 器 已 经 创建 了 该 对 象 ) 。 

System V IPC 定 义 了 自己 的 IPC_xxx 常 值 ， 而 不 像 标 准 open 函 数 以 
及 Posix IPC 函 数 那样 使 用 O_CREAT 和 O_EXCL 常 值 (参见 图 2-3) 。 

还 要 注意 的 是 ，System V IPC 函 数 把 它们 的 IPC_xxx 常 值 跟 权 限 位 
(将 在 下 一 节 讲 述 ) 组 合 到 单个 oflag 参 数 中 。open 函 数 以 及 Posix IPCER 
数 有 一 个 名 为 oflag 的 参数 ， 用 以 指定 各 种 O_xxx 标 志 ， 另 有 一 个 名 为 
mode 的 参数 ， 用 以 指定 权限 位 。 














3.5 IPC 权 限 


每 当 使 用 某 个 getXXX 函 数 〈 指 定 IPC_CREAT 标 志 ) 创建 一 个 新 的 
IPC 对 象 时 ， 以 下 信息 就 保存 到 该 对 象 的 ipc_perm 结 构 中 (3.3 节 ) 。 

(1)oflag 参 数 中 某 些 位 初始 化 ipc_perm 结 构 的 mode 成 员 。 图 3-6 展 示 
了 System ”V 三 种 不 同 IPC 机 制 的 权限 位 (记号 >>3 的 童 思 是 将 值 石 移 3 
KE) 








TM 
(八进制 ) 消息 队列 号 量 共享 内 存 区 


0200 MSG W SEM A SHM W 由 用 户 ( 属 主 ) 写 


0040 MSG R >> 3 SEM R >> 3 SHM R >> 3 由 ( 属 ) 组 成 员 读 
0004 MSG R >> 6 SEM R >> 6 SHM R >> 6 由 其 他 用 户 读 
mecs | dl 








图 3-6 IPC 读 写 权 限 的 mode 值 

(2)cuid 和 cgid 成 员 分 别 设 置 为 调用 进程 的 有 效用 户 ID 和 有 效 组 ID。 
这 两 个 成 员 合 称 为 创建 者 ID (creator ID) 。 

(3)ipc_perm 结 构 的 uid 和 gid 成 员 也 分 别 设置 为 调用 进程 的 有 效用 户 
ID 和 有 效 组 ID。 这 两 个 成 员 合 称 为 属 主 ID CownerID) 。 

尽管 一 个 进程 可 通过 调用 相应 IPC 机 制 cdtXXX 函 数 〈 所 用 命令 为 
IPC SET) 修改 属 主 ID， 创 建 者 ID 却 从 不 改变 。 这 三 个 ctIXXX 函 数 还 多 
许 一 个 进程 修改 某 个 IPC 对 象 的 mode 成 员 。 

多 数 实 现在 <sys/msg.h>、<sys/sem.h> 和 <sys/shm.h> 这 三 个 头 文件 
中 定义 图 3-6 中 所 示 的 6 个 常 值 : MSG_R、MSG_W、SEM_R、 
SEM_A、SHM_R、SHM_W。 不 过 Unix 98 没 有 这 样 的 要 求 。SEM_A 中 
的 后 级 A 代表 “alter”( 改 变 ) 。 

这 三 个 ctlXXX 函 数 不 使 用 通常 的 文件 模式 创建 掩 码 。 消 恩 队 列 、 信 
号 量 或 共享 内 存 区 对 象 的 权限 准确 地 设置 成 由 这 些 函 数 所 指定 的 值 。 

Posix IPC 并 不 允许 一 个 IPC 对 象 的 创建 者 改变 该 对 象 的 属 主 。Posix 
IPC 中 没有 类 似 于 IPC_SET 命 令 的 操作 。 然 而 如 果 Posix IPC 名 字 存 储 在 
文件 系统 中 ， 那 么 超级 用 户 可 使 用 chown 命 令 改 变 其 属 主 。 

每 当 有 一 个 进程 访问 某 个 IPC 对 象 时 ，IPC 就 执行 两 级 检查 ， 该 IPC 
对 象 被 打开 时 CgetXX X eK BO) 执行 一 次 ， 以 后 每 次 使 用 该 对 象 时 执行 
一 次 。 

(1 每 当 有 一 个 进程 以 某 个 getXXX 函 数 建立 访问 某 个 已 存在 IPC 对 象 
的 通道 时 ，IPC 就 执行 一 次 初始 检查 ， 验 证 调用 者 的 oflag 参 数 没有 指定 
不 在 该 对 象 pc_perm 结 构 mode 成 员 中 的 任何 访问 位 。 这 就 是 图 3-4 中 底 
部 的 方 框 。 举 例 来 说 ， 一 个 服务 器 进程 可 以 把 它 的 输入 消息 队列 的 
mode 成 员 设置 成 关 掉 组 成 员 恋 和 其 他 用 户 读 这 两 个 权限 位 。 任 何 进程 
调用 针对 该 消息 队列 的 msgget 函 数 时 ， 如 果 所 指定 的 oflag 参 数 包含 这 两 
位 ， 那 么 该 函数 都 将 返回 一 个 错误 。 然 而 由 getXXX 函 数 完成 的 这 种 测 

















试 并 没有 多 大 用 处 。 它 隐 含 假定 调用 者 知道 自己 属于 哪个 权限 范畴 一 一 
用 户 、 组 成 员 或 其 他 用 户 。 如 果 创 建 者 特意 关 挥 了 某 些 权限 位 ， 而 调用 
者 却 指定 了 这 些 位 ， 那 么 getXXX 函 数 将 检测 出 这 个 错误 。 然 而 任何 进 
程 都 能 够 完全 绕 过 这 种 检查 ， 其 办 法 是 在 得 知 该 IPC 对 象 已 存在 后 ， 简 
单 地 指定 一 个 值 为 0 的 oflag 人 参数 即 可 。 

(2) 每 次 IPC 操 作 都 对 使 用 该 操作 的 进程 执行 一 次 权限 测试 。 举 例 来 
说 ， 每 当 有 一 个 进程 试图 使 用 msgsnd 函 数 往 某 个 消息 队列 放置 一 个 消息 
时 ，msgsnd 冰 数 将 以 下 面 所 列 的 顺序 执行 〈 多 个 ) 测试 。 一 旦 某 个 测试 
赋予 了 访问 权 ， 其 后 的 测试 就 不 再 执行 。 

a) 超 级 用 户 总 是 赋予 访问 权 。 

b) 如 有 条 当前 进程 的 有 效用 户 ID 等 于 该 IPC 对 象 的 uid 值 或 cuid 值 ， 而 
且 相 应 的 访问 位 在 该 IPC 对 象 的 mode 成 员 中 是 打开 的 ， 那 么 赋予 访问 
权 。 这 儿 “ 相 应 的 访问 位 ”的 意思 是 ， 如 果 调 用 者 想 要 在 该 IPC 对 象 上 执 
行 一 个 读 操作 (例如 从 某 个 消息 队列 接收 一 个 消息 ) ， 那 么 读 位 必须 设 
置 ， 如 果 想 要 执行 一 个 写 操作 ， 那 么 写 位 必须 设置 。 

oo 如 果 当 前 进程 的 有 效 组 ID 等 于 该 IPC 对 象 的 gid 值 或 cgid 值 ， 而 且 
相应 的 访问 位 在 该 IPC 对 象 的 mode 成 员 中 是 打开 的 ， 那 么 赋予 访问 权 。 

d) 如 果 上 面 的 测试 没有 一 个 为 真 ， 那 么 相应 的 “其 他 用 户 ” 访 问 位 在 
该 IPC 对 象 的 mode 成 员 中 必须 是 打开 的 才能 赋予 访问 权 。 











3.6 标识 符 


ipc_perm 结 构 〈3.3 节 ) 还 含有 一 个 名 为 seq 的 变量 ， 它 是 一 个 模 位 
使 用 情况 序列 号 。 该 变量 是 一 个 由 内 核 为 系统 中 每 个 潜在 的 IPC 对 象 维 
护 的 计数 器 。 每 当 删 除 一 个 IPC 对 象 时 ， 内 核 吉 递增 相应 的 槽 位 号 ， 知 
溢出 则 循环 回 0。 

我 们 在 本 节 讲 述 的 是 普通 SVR4 实 现 。Unix 98 没 有 强制 使 用 该 实现 


技巧 。 

该 计数 器 的 存在 有 两 个 原因 。 首 先 ， 考 虑 由 内 核 维 护 的 用 于 打开 文 
件 的 文件 描述 符 。 它 们 是 些小 整数 ， 只 在 单个 进程 内 有 意义 ， 也 就 是 它 
们 是 进程 特定 的 值 。 如 果 我 们 试图 从 壁 如 说 文件 描述 符 4 读 ， 那 么 这 种 
尝试 只 有 该 进程 已 在 该 描述 符 上 打开 了 一 个 文件 后 才 会 奏效 。 它 对 于 可 
能 在 另外 一 个 与 本 进程 无 亲缘 关系 的 进程 中 打开 在 文件 摘 述 符 4 上 的 文 
件 来 说 ， 根 本 没有 意义 。 然 而 ，System V IPC 标 识 符 却 是 系统 范围 的 ， 
而 不 是 特定 于 进程 的 。 

我 们 从 某 个 get 函 数 (msgget、semget 和 shmget) 获得 一 个 IPC 标 识 
符 《〈 类 似 于 文件 描述 符 ) 。 这 些 标识 符 也 是 整数 ， 不 过 它们 的 意义 适用 
于 所 有 进程 。 举 例 来 襄 ， 如 果 有 两 个 无 杀 缘 关系 的 进程 (一 个 是 客户 ， 
一 个 是 服务 器 ) 使 用 单个 消息 队列 ， 那 么 由 msgget 函 数 返 回 的 该 消息 队 
列 的 标识 符 在 双方 进程 中 必须 是 同一 个 整数 值 ， 这 样 双方 才能 访问 同一 
个 消 妃 队列 。 这 种 特性 意味 着 某 个 行为 不 端的 进程 可 能 答 试 从 另外 某 个 
应 用 的 消息 队列 中 旋 消 息 ， 办 法 是 答 试 不 同 的 小 整数 标识 符 ， 以 期 竺 找 
出 一 个 当前 在 使 用 的 允许 大 家 读 访问 的 消息 队列 。 要 是 这 些 标 识 符 的 取 
值 是 小 整数 〈 像 文件 描述 符 那 样 ) ， 那 么 找到 一 个 有 效 标 识 符 的 可 能 性 
约 为 150《〈 假 设 每 个 进程 最 多 有 约 50 个 摘 述 符 ) 。 

为 避免 这 样 的 问题 ， 这 些 IPC 机 制 的 设计 者 们 把 标识 符 值 的 可 能 范 
围 扩 大 到 包含 所 有 整数 ， 而 不 是 仅仅 包含 小 整数 。 这 种 扩大 是 这 么 实现 
的 : 每 次 重用 一 个 IPC 表 项 时 ， 把 返回 给 调用 进程 的 标识 符 值 增加 一 个 
IPC 表 项 数 。 举 例 来 说 ， 如 果 系 统 配置 成 最 多 50 个 消息 队列 ， 那 么 内 核 
中 的 第 一 个 消息 队列 表 项 首次 被 使 用 时 ， 返 回 给 进程 的 标识 符 值 为 0。 
该 消息 队列 被 删除 ， 从 而 第 一 个 表 项 得 以 重用 后 ， 所 返回 的 标识 符 为 
50。 再 下 一 次 重用 时 ， 访 标识 符 变 为 100， 如 此 等 等 。 既 然 sq 变 量 通常 
作为 一 个 无 符号 长 整数 实现 〈 见 3.3 节 所 示 的 ipc_perm 结 构 ) ， 那 么 该 表 




















项 只 有 在 被 重用 85 899 346 (2?? /50， 假 设 长 整数 为 32 位 ) 次 后 才 循 环 
回 0。 

递增 模 位 使 用 情况 序列 号 的 另 一 个 原因 是 为 了 避免 短 时 间 内 重用 
System V IPC 标 识 符 。 这 有 助 于 确保 过 早 终止 的 服务 器 重新 启动 后 不 会 
重用 标识 符 。 

作为 这 种 特性 的 一 个 例子 ， 图 3-7 中 的 程序 输出 由 msgget 返 回 的 前 
10 个 标识 符 值 。 








svmsg/slot.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 { 
5 int i, msqid; 
6 for (i = 0; i« 10; i++) { 
7 msqid = Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
8 printf ("msqid = %d\n", msqid) ; 
9 Msgctl(msqid, IPC RMID, NULL); 
10 } 
11 exit (0); 
12 } 
svmsg/slot.c 

















图 3-7 连续 输出 由 内 核 赋 予 的 消息 队列 标识 符 10 次 
REO Himsgget le ei 妃 队 列 ， 然 后 由 使 用 IPC_RMID 命 令 
的 msgctl 删 除 该 队列 。 常 值 SVMSG_MODE 定 义 在 我 们 的 unpipc.h 头 文件 
H (AIC-1) ， 它 给 我 们 的 System V 消 息 队 列 指定 默认 权限 位 。 该 程序 
的 输出 如 下 : 


solaris % slot 











msgid = 0 
msgid = 50 
msqid = 100 
msqid = 150 
msqid = 200 


msqid = 250 


msqid = 300 
msqid = 350 
msqid = 400 
msqid = 450 

如 果 再 次 运行 该 程序 ， 我 们 就 能 看 出 槽 位 使 用 情况 序列 号 是 一 个 跨 

进程 保持 的 内 核 变 量 。 

solaris % slot 
msqid = 500 
msqid = 550 
msqid = 600 
msqid = 650 
msqid = 700 
msqid = 750 
msqid = 800 
msqid = 850 
msqid = 900 
msqid = 950 


3.7 ipcs 和 记 crm 程 序 


由 于 System V IPC 的 三 种 类 型 不 是 以 文件 系统 中 的 路 径 名 标识 的 ， 
因此 使 用 标准 的 ls 和 rm 程序 无 法 看 到 它们 ， 也 无 法 删除 它们 。 不 过 实现 
了 这 些 类 型 IPC 的 任何 系统 都 提供 两 个 特殊 的 程序 .ipcs 和 ipcrm。ipcs 输 
出 有 关 System V IPC 特 性 的 各 种 信息 ，ipcrm 则 删除 一 个 System VIF As. BA. 
列 、 信 和 号 量 集 或 共享 内 存 区 。 前 者 支持 约 十 来 个 命令 行 选项 ， 它 们 决定 
报告 哪 种 类 型 的 IPC 以 及 输出 哪些 信息 ， 后 者 文 持 6 个 命令 行 选项 。 所 有 
这 些 选项 的 详细 信息 可 查阅 它们 的 手册 页 面 。 








System V IPC 不 是 Posix 中 的 内 容 ， 因 此 这 两 个 命令 也 未 被 Posix.2 标 
准 化 。 不 过 它们 是 Unix 98 的 内 容 。 


3.8 内 核 限 第 





System V IPC 的 多 数 实现 有 内 在 的 内 核 限制 ， 例 如 消息 队列 的 最 大 
数目 、 每 个 信号 量 集 的 最 大 信号 量 数 ， 等 等 。 我 们 将 在 图 6-25、 图 11-8 
和 图 14-5 中 给 出 这 些 限 制 的 某 些 典型 值 。 这 些 限制 通常 起 源 于 最 初 的 
System V 实 现 。 

[Bach 1986] 的 11.2 节 和 [Goodheart and Cox 1994] 的 第 8 章 都 讲 
述 了 消息 队列 、 信 和 号 量 和 共享 内 存 区 的 实现 。 某 些 限 制 就 在 那儿 说 明 。 

不 幸 的 是 ， 这 些 对 象 的 大 小 被 内 核 限 制 得 往往 太 小 ， 这 是 因为 其 中 
许多 限制 起 源 于 在 某 个 小 地 址 空间 系统 (16 位 PDP-11) 上 完成 的 最 初 实 
现 。 然 而 万 这 的 是 ， 多 数 系 统 允许 管理 员 部 分 或 完全 修改 这 些 默 认 限 
制 ， 但 是 不 同 风格 的 Unix 所 需 的 步骤 也 不 一 样 。 多 数 系 统 要求 在 修改 完 
值 后 重新 自 举 运行 中 的 内 核 。 尽 管 如 此 ， 某 些 实现 仍然 给 其 中 一 些 限制 
使 用 16 位 整数 ， 这 在 无 形 之 中 提供 了 一 个 难以 突破 的 硬 限 制 。 

举例 来 说 ，Solaris 2.6 有 20 个 这 些 限制 。 它 们 的 当前 值 可 使 用 sysdef 
命令 输出 ， 不 过 如 果 相 应 的 内 核 模块 尚未 加 载 〈 也 就 是 说 尚未 使 用 IPC 
机 制 ) ， 那 么 所 输出 的 值 为 0。 它 们 的 值 可 通过 在 /etcsystem 文 件 中 加 入 
如 下 语句 来 修改 ， 而 /etc/system 是 自 举 内 核 时 读 入 的 。 


set msgsys:msginfo_msgseg = value 





set msgsys:msginfo_msgssz = value 
set msgsys:msginfo msgtql = value 
set msgsys:msginfo msgmap - value 
set msgsys:msginfo msgmax - value 


set msgsys:msginfo msgmnb - value 


set msgsys:msginfo_msgmni = value 
set semsys:seminfo_semopm = value 
set semsys:seminfo_semume = value 
set semsys:seminfo_semaem = value 
set semsys:seminfo_semmap = value 
set semsys:seminfo_semvmx = value 
set semsys:seminfo_semmsl = value 
set semsys:seminfo semmni = value 
set semsys:seminfo semmns - value 
set semsys:seminfo semmnu - value 
set shmsys:shminfo shmmin - value 
set shmsys:shminfo shmseg = value 
set shmsys:shminfo shmmax = value 
set shmsys:shminfo shmmni = value 
等 号 左边 名 字 中 节 后 6 个 字符 就 是 列 在 图 6-25、 图 11-8 和 图 14-5 中 的 

















至 于 Digital Unix 4.0B，sysconfig 程 序 可 用 于 人 查询 或 修改 许多 内 核 参 
数 和 限制 。 下 面 是 使 用 -gq 选项 时 该 程序 的 输出 ， 它 就 ipc 子 系统 查询 内 核 
以 输出 当前 限制 值 。 我 们 已 省 略 近 了 与 System V IPC 机 制 无 关 的 一 些 
{Te 





alpha % /sbin/sysconfig -q ipc 
ipc: 

msg-max = 8192 

msg-mnb = 16384 

msg-mni = 64 

msg-tql = 40 

shm-max = 4194304 


shm-min = 1 

shm-mni = 128 

shm-seg = 32 

sem-mni = 16 

sem-msl = 25 

sem-opm - 10 

sem-ume - 10 

sem-vmx = 32767 

sem-aem = 16384 

num-of-sems = 60 

这 些 参数 的 默认 值 可 通过 在 /etc/sysconfigtab 文 件 中 指定 不 同 的 值 来 
修改 ， 不 过 该 文件 应 使 用 sysconfigdb 程 序 维护 。 该 文件 是 在 系统 自 举 时 
读 入 的 。 





3.9 小 结 


msgget、semget 和 shmget 这 三 个 函数 的 第 一 个 参数 是 一 个 System V 
IPC 键 。 这 些 键 通常 是 使 用 系统 的 ftok 函 数 从 某 个 路 径 名 创建 出 的 。 键 还 
可 以 是 IPC_PRIVATE 这 个 特殊 值 。 这 三 个 函数 创建 一 个 新 的 IPC 对 象 或 
打开 一 个 已 存在 的 IPC 对 象 ， 并 返回 一 个 System V. IPC 标 识 符 : 接 下 去 
用 于 给 其 余 IPC 函 数 标 识 该 对 象 的 一 个 整数 。 这 些 整数 不 是 特定 于 进程 
的 标识 符 〈 像 描述 符 那 样 ) ， 而 是 系统 范围 的 标识 符 。 这 些 标识 符 还 由 
内 核 在 一 段 时 间 后 重用 。 

与 每 个 System V IPC 对 象 相关 联 的 是 一 个 ijpc_perm 结 构 ， 它 含有 诸 
如 属 主 的 用 户 ID、 组 ID、 读 写 权 限 等 信息 。Posix IPC 和 System V IPC 的 
差别 之 一 是 ， 这 些 信息 对 于 System V IPC 对 象 总 是 可 用 的 (通过 以 
IPC_STAT 命 令 参 数 调用 三 个 ctl/XXX 函 数 中 的 某 一 个 ) ， 但 是 对 于 Posix 











IPC 对 象 来 说 ， 能 否 访问 这 些 信息 要 看 具体 实现 。 如 果 Posix IPC 对 象 存 
放 在 文件 系统 中 ， 而 且 我 们 知道 它们 在 文件 系统 中 的 名 字 ， 那 么 使 用 现 
有 的 文件 系统 工具 就 能 访问 到 与 ipc_perm 结 构 的 内 容 相 同 的 信息 。 

在 创建 一 个 新 的 System V IPC 对 象 或 打开 一 个 已 存在 的 对 象 时 ， 可 
给 getXXX 函 数 指定 两 个 标志 (IPC_CREAT 和 IPC_EXCL) ， 外 加 9 个 权 
限 位 。 

训 无 疑问 ， 使 用 System V IPC 的 最 大 问题 在 于 多 数 实现 在 这 些 对 象 
的 大 小 上 施加 了 人 为 的 内 核 限制 ， 这 些 限制 可 追溯 到 它们 历史 上 的 最 初 
实现 。 这 就 是 说 ， 较 多 使 用 System V IPC 的 多 数 应 用 需要 系统 管理 员 修 
改 这 些 内 核 限 制 ， 然 而 不 同 风格 的 Unix 完 成 这 些 修改 工作 的 步骤 也 不 一 
样 。 








习题 


3.4 粗 读 一 下 6.5 节 的 msgctl 函 数 ， 把 图 3-7 中 的 程序 修改 成 除 输 出 所 
赋予 的 标识 符 外 ， 还 输出 jpc_perm 结 构 的 seq 成 员 。 

3.2 运行 图 3-7 中 的 程序 两 次 后 立即 运行 一 个 创建 两 个 消息 队列 的 程 
序 。 假 设 内 核 从 自 举 以 来 没有 任何 其 他 应 用 程序 使 用 过 其 他 消息 队列 ， 
那么 由 内 核 返回 的 作为 消息 队列 标识 符 的 两 个 值 是 什么 ? 

3.3 我 们 在 3.5 节 中 指出 System V IPC getXXX 函 数 不 使 用 文件 模式 创 
建 掩 码 。 编 写 一 个 测试 程序 ， 由 它 创 建 一 个 FIFO《〈 使 用 4.6 节 中 所 述 的 
mkfifo 2%) 和 一 个 System V 消 恩 队 列 ， 给 它们 指定 的 权限 都 是 666( 八 
进 制 ) 。 比 较 创建 成 的 FIFO 和 消息 队列 二 者 的 权限 。 在 运行 该 程序 前 ， 
确保 你 的 shell umask 为 非 零 值 。 

3.4 如 果 一 个 服务 器 想 要 为 其 客户 创建 一 个 唯一 的 消息 队列 ， 那 么 
采用 哪 种 方法 更 恰当 一 一 使 用 某 个 常 值 路 径 名 《譬如 说 该 服务 器 的 可 执 
行文 件 ) 作为 ftok 的 一 个 参数 呢 ， 还 是 使 用 IPC_PRIVATE? 








3.5 修改 图 3-2 使 其 只 输出 IPC 键 和 路 径 名 。 运 行 find 程 序 输出 你 的 系 
统 上 的 所 有 路 径 名 ， 并 将 这 些 路 径 名 逐个 作为 刚 修 改过 的 程序 的 命令 行 
参数 运行 之 。 有 多 少 路 径 名 映射 到 同一 键 值 上 ? 

3.6 ”如 果 你 的 系统 文 持 sar 程 序 (“ 系 统 行为 报告 程序 ”) ， 那 么 运行 
如 下 命令 : 

Sar -m 5 6 

该 命令 输出 每 秒 钟 的 消息 队列 操作 数 和 信和 号 量 操作 数 ， 采 样 频率 为 
5 秒 钟 一 次 ， 共 6 次 。 





[1]. 意思 是 用 新 的 出 错 处 理 函 数 代 丛 原来 的 err_ sys， 这 样 对 线程 函数 的 
调用 可 直接 作为 新 的 出 错 处 理 函 数 中 增设 的 参数 用 ， 即 

err sys new("pthread mutex lock 
error",pthread mutex lock(&ndone mutex)). — —iE fic 


[2]. snprinf 现 在 已 经 是 C99 标 准 的 函数 。 一 -一 编者 注 


[3]. 此 处 为 APUE 第 1 版 英文 原版 书页 码 ， 第 2 版 为 第 97 一 100 页 ， 第 2 版 
中 文 版 为 第 80 一 82 页 。 4 


[4]. ERA TS Le SCR AAS, 282553 73J*816— 1791. FAQ PITH 
为 第 12 一 13 页 。 一 ”编者 注 


[5]. Unix 98 现 在 宣称 : 当 ftok 的 id 参 数 的 低 序 8 位 为 0 时 ， 该 函数 的 行为 
是 未 指定 的 。 碍 看 一 番 后 作者 发 现 Solaris 和 Digital Unix 中 关于 ftok 的 手 
册页 面 也 作 了 同样 的 声明 。 作 者 不 知道 这 是 什么 时 候 加 上 的 ， 而 且 作者 
于 1991 年 编写 的 “System V Interface Definition” 中 也 没有 这 样 的 声明 。 
AIX 甚 至 走 得 更 远 ， 在 id 为 0 则 返回 一 个 错误 。 实 际 上 ftok 的 三 种 不 同 实 
现 没有 一 个 要 求 id 为 
APS: 它们 只 是 和 id 的 低 序 8 位 中 作 远 罗 辑 或 ， 而 不 管 它 的 值 。 
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第 4 章 管道 和 FIFO 
4.1 概述 


管道 是 最 初 的 Unix IPC 形 式 ， 可 追溯 到 1973 年 的 Unix 第 3 版 [Salus 
1994] 。 尽 管 对 于 许多 操作 来 说 很 有 用 ， 但 它们 的 根本 局 限 在 于 没有 名 
字 ， 从 而 只 能 由 有 亲缘 关系 的 进程 使 用 。 这 一 点 随 FIFO 的 加 入 在 System 
III Unix (1982 年 ) 中 得 以 改正 。FIFO 有 时 称 为 有 名 管道 (named 
pipe) 。 管 道 和 FIFO 都 是 使 用 通 癌 的 read 和 write 函数 访问 的 。 

技术 上 讲 ， 自 从 可 以 在 进程 间 传递 描述 符 《〈 在 本 书 15.8 节 和 UNPvl 
的 14.7 节 中 讲述 ) 后 ， 管 道 也 能 用 于 无 亲缘 关系 的 进程 间 。 然 而 现实 
中 ， 管 道 通常 用 于 具有 共同 祖先 的 进程 间 。 

本 章 讲述 管道 和 FIFO 的 创建 与 使 用 。 我 们 使 用 一 个 简单 的 文件 服务 
器 例子 ， 同 时 碍 看 一 些 客户 -服务 器 程序 设计 问题 : IPC 通 道 需 要 量 、 友 
代 服 务 器 与 并 发 服务 器 、 字 节 流 与 消息 接口 。 

















4.2 一 个 简 > = rA S | 





图 4-1 所 示 的 客户 -服务 器 例子 在 本 半 和 第 6 章 中 都 要 用 到 ， 我 们 用 它 
来 分 析 说 明 管 道 、FIFO 和 System V 消 息 队 列 。 


路 径 名 标准 输入 .. eS 
Uy pn " C d J 务 器 
文件 内 容 或 le _ 文 件 内 容 或 出 错 消息 。 ”|」 服务 器 Catt) 


出 错 消息 标准 输出 
图 4-1 客户 -服务 器 例子 

图 中 客户 从 标准 输入 (stdin) 读 进 一 个 路 径 名 ， 并 把 它 写 入 IPC 通 
道 。 服 务 器 从 该 IPC 通 道 读 出 这 个 路 径 名 ， 并 尝试 打开 其 文件 来 读 。 如 
果 服 务 器 能 打开 该 文件 ， 它 就 读 出 其 中 的 内 容 ， 并 写 入 可 能 男 一 个 ) 
IPC 通 道 ， 以 作为 对 客户 的 啊 应 ; A, "EXLURWDEA— RR. Tm 
户 随 后 从 该 IPC 通 道 读 出 啊 应 ， 并 把 它 写 到 标准 输出 (stdout)〉 。 如 果 服 
务 器 无 法 读 该 文件 ， 那 么 客户 读 出 的 响应 将 是 一 个 出 错 消 恩 。 否 则 ， 客 
户 读 出 的 响应 就 是 该 文件 的 内 容 。 客 户 和 服务 占 之 间 的 虚线 表示 IPC 通 








所 有 式样 的 Unix 都 提供 管道 。 它 由 pipe 函 数 创 建 ， 提 供 一 个 单 路 
( 单 向 ) 数据 流 。 

#include <unistd.h> 

int pipe(int fd[2]); 

返回 : 大 成 功 则 为 0， 知 出 错 则 为 -1 

该 函数 返回 两 个 文件 描述 符 : fd[0] 和 fd[1]。 前 者 打开 来 读 ， 后 者 打 
HR 

有 些 版 本 的 Unix( 例 如 SVR4) 提供 全 双 工 管道 ， 也 天 是 说 这 些 管 
道 的 两 端 都 是 既 可 用 于 读 ， 也 可 用 于 写 。 创 建 一 个 全 双 工 IPC 管 道 的 男 
一 种 方法 是 使 用 UNPvl 的 14.3 节 中 讲述 的 socketpair 函 数 ， 它 在 大 多 数 现 
行 Unix 系 统 上 都 能 工作 。 然 而 管道 的 最 弟 见 用 途 是 用 在 各 种 shell 中 ， 这 
种 情况 下 半 双 工 管道 足够 了 。 





Posix.1 和 Unix 98 只 要 求 半 双 工 管道 ， 本 章 中 我 们 也 这 么 假设 。 

宏 $S_ISFIFO 可 用 于 确定 一 个 描述 符 或 文件 是 管道 还 是 FIFO。 它 的 
唯一 参数 是 stat 结 构 的 st_mode 成 员 ， 计 算 结 果 或 者 为 真 〈 非 零 值 ) ， 或 
者 为 假 O) 。 对 于 管道 来 说 ， 这 个 stat 结 构 是 由 fstat 函 数 填写 的 。 对 于 
FIFO 来 说 ， 这 个 结构 是 由 fstat、lstat 或 stat 函 数 填 写 的 。 

图 4-2 展 示 了 单个 进程 中 管道 的 模样 。 











进程 






fa[0] 





fa[1] 


一 数据 流 一 





图 4-2 单个 进程 中 的 管道 

尽管 管道 是 由 单个 进程 创建 的 ， 它 却 很 少 在 单个 进程 内 使 用 《我 们 

将 在 图 5-14 中 给 出 在 单个 进程 内 使 用 管道 的 一 个 例子 ) 。 管 道 的 典型 用 

途 是 以 下 述 方式 为 两 个 不 同 进程 〈 一 个 是 父 进程 ， 一 个 是 子 进程 ) 提供 

进程 间 的 通信 手段 。 首 先 ， 由 一 个 进程 〈 它 将 成 为 父 进 程 ) 创建 一 个 管 
道 后 调用 fork 派 生 一 个 自 映 的 副本 ， 如 图 4-3 所 示 。 


























父 进 程 子 进 程 


fa[0] fa[0] 
fa[1] 





一 数据 流 一 
图 4-3 单个 进程 内 的 管道 ， 刚 刚 fork 后 
接着 ， 父 进程 关闭 这 个 管道 的 读 出 端 ， 子 进程 关闭 同一 管道 的 写 入 
端 。 这 就 在 父 PALE T — RRR, a as. 





父 进程 子 进 程 


进程 


内 核 





一 数据 流 一 
图 4-4 两 个 进程 间 的 管道 


























who | sort | Ip 

我 们 在 某 个 Unix shell 中 输入 一 个 像 下 面 这 样 的 命令 时 : 

该 shel] 将 执行 上 述 步骤 创建 三 个 进程 和 其 间 的 两 个 管道 。 它 还 把 每 
管道 的 读 出 端 复制 到 相应 进程 的 标准 输入 ， 把 每 个 管道 的 写 入 端 复制 











到 相应 进程 的 标准 输出 。 图 4-5 展 示 了 这 样 的 管道 线 。 


who 进 程 sort 进 程 lp 进程 





一 数据 流 一 一 数据 流 一 
图 4-5 某 个 shell 管 道 线 中 三 个 进程 间 的 管道 
到 此 为 止 所 示 的 所 有 管道 都 是 半 双 工 的 即 单 向 的 ， 只 提供 一 个 方向 
的 数据 流 。 当 需要 一 个 双向 数据 流 时 ， 我 们 必须 创建 两 个 管道 ， 每 个 方 
回 一 个 。 实 际 步骤 如 下 : 
(1) 创 建 管道 1 Cfdi[opfüfdi[1]) 和 管道 2 〈fd2[0] 和 fdq2[1]) ; 
(2)fork; 
(3) 父 进程 关闭 管道 1 的 读 出 端 〈fdl[0]) ; 
(4) 父 进程 关闭 管道 2 的 写 入 端 〈fd2[1] ) ; 
(5) 子 进程 关闭 管道 1 的 写 入 端 〈fdl[1] ; 
(6) 子 进程 关闭 管道 2 的 读 出 端 〈fd2[0]) 。 
图 4-8 给 出 了 执行 这 些 步骤 的 代码 。 它 产生 如 图 4-6 所 示 的 管道 布 
































例子 

现在 使 用 管道 实现 4.2 节 中 描述 的 客户 一 服务 怖 例子 。main 函 数 创 
建 两 个 管道 并 用 fork 生 成 一 个 子 进程 。 客 户 然 后 作为 父 进程 运行 ， 服 务 
器 则 作为 子 进程 运行 。 第 一 个 管道 用 于 从 客户 回 服 务 器 发 送 路 径 名 ， 第 
二 个 管道 用 于 从 服务 器 同 客 户 发 送 该 文件 的 内 容 〈 或 者 一 个 出 错 消 
BO 。 这 样 设置 后 的 布局 如 图 4-7 所 示 。 





fa2[1] 


fal [0] 










一 数据 流 一 
图 4-6 提供 一 个 双 同 数据 流 的 两 个 管道 
= fe te 父 进程 路 径 名 子 进程 
T 住 输入 — 
文件 内 容 或 


出 销 消息 标准 输出 文件 内 容 或 出 错 消息 


图 4-7 使 用 两 个 管道 实现 图 4-1 
注意 图 4-7 所 示 的 两 个 管道 直接 连接 着 两 个 进程 ， 然 而 实际 上 它们 
都 是 通过 内 核 运 作 的 ， 如 图 4-6 所 示 。 因 此 ， 从 客户 到 服务 器 以 及 从 服 
务 需 到 客户 的 所 有 数据 都 穿越 了 用 户 - 内 核 接口 两 次 : 一 次 是 在 写 入 管 
道 时 ， 男 一 次 是 在 从 管道 读 出 时 。 
图 4-8 给 出 了 这 个 例子 的 main 函 数 。 











pipe/mainpipe.c 


1 #include "unpipc.h" 
2 void client(int, int), server(int, int); 
3 int 


4 main(int argc, char **argv) 
5 { 


6 int pipel[2], pipe2 [2]; 

5 pid t childpid; 

8 Pipe (pipel); /* create two pipes */ 

9 Pipe (pipe2); 

10 if ( (childpid = Fork()) -- 0) { /* child */ 
11 Close (pipel[1]); 

12 Close (pipe2 [0] ) ; 

13 server (pipel [0] pipe2[1]); 

14 exit (0); 

15 } 

16 /* parent */ 

17 Close (pipe1[0]); 

18 Close (pipe2 [1] ) ; 

19 client (pipe2[0], pipel[11); 
20 Waitpid(childpid, NULL, 0); /* wait for child to terminate */ 
21 exit (0); 


22 } 





pipe/mainpipe.c 





图 4-8 使 用 两 个 管道 的 客户 -服务 器 程序 main 函 数 

创建 管道 ，fork 

8 一 19 创建 两 个 管道 ， 然 后 执行 随 图 4-6 列 出 的 6 个 步骤 。 父 进程 调 
Hicliente Zi CEd4-9) ， 子 进程 调用 server 函 数 〈 图 4-10) 。 

为 子 进 程 waitpid 

20 服务 器 〈 子 进程 ) 在 往 管道 写 入 最 终 数 据 后 调用 exit 首 先 终止 。 
它 随后 变 成 了 一 个 僵尸 进程 (zombie): 自身 已 终止 、 但 其 父 进程 仍 在 
运行 且 疝 未 等 待 该 子 进程 的 进程 。 当 了 于 进程 终止 时 ， 内 核 还 给 其 父 进程 
产生 一 个 SIGCHLD 信 号， 不 过 父 进程 没有 捕获 这 个 信号 ， 而 该 信和 号 的 
默认 行为 台 是 忽略 。 此 后 不 久 ， 父 进程 的 client 函 数 在 从 管道 谈 入 最 终 
数据 后 返回 。 父 进程 随后 调用 waitpid 取 得 已 终止 子 进程 〈 僵 尸 进 程 ) 的 
终止 状态 。 要 是 父 进 程 没有 调用 waitpid， 而 是 直接 终止 ， 那 么 子 进 程 将 
成 为 托 孤 给 init 进 程 的 孤儿 进程 ， 内 核 将 为 此 同 init 进 程 发 送 男 外 一 个 
SIGCHLD 信 号 ，init 进 程 随 后 将 取得 该 僵尸 进程 的 终止 状态 











client 函 数 如 图 4-9 所 示 。 








pipe/client.c 
1 #include "unpipc.h" 
2 void 
3 client(int readfd, int writefd) 
a { 
5 size_t len; 
6 ssize t n; 
d char buff [MAXLINE] ; 
8 /* read pathname */ 
9 Fgets (buff, MAXLINE, stdin) ; 
10 len = strlen(buff) ; /* fgets() guarantees null byte at end */ 
ga: if (buff[len-1] == '\n') 
12 len--; /* delete newline from fgets() */ 
13 /* write pathname to IPC channel */ 
14 Write (writefd, buff, len); 
15 /* read from IPC, write to standard output */ 
16 while ( (n = Read(readfd, buff, MAXLINE)) > 0) 
1g Write (STDOUT_FILENO, buff, n); 
18 } 
pipe/client.c 





图 4-9 使 用 两 个 管道 的 客户 -服务 器 程序 client 函 数 

从 标准 输入 读 进 路 径 名 

8 一 14 从 标准 输入 读 进 路 径 名 后 ， 删 除 其 中 由 fgets 存 入 的 换行 符 ， 
再 写 入 管道 。 

从 管道 复制 到 标准 输出 

15—17 ”客户 随后 读 出 由 服务 器 写 入 管道 的 全 部 内 容 ， 并 写 到 标准 
输出 。 正 常情 况 下 它 是 所 请 求 文件 的 内 容 ， 但 是 如 果 服 务 器 打 不 开 所 指 
定 的 路 径 名 ， 那 它 将 返回 一 个 出 错 消息 。 

server 函 数 如 图 4-10 所 示 。 

从 管道 读 出 路 径 名 

8 一 11 从 管道 读 出 由 客户 写 入 的 路 径 名 ， 并 以 空 字 节 作 为 其 结尾 。 
注意 ， 对 一 个 管道 的 read 只 要 该 管道 中 存在 一 些 数据 就 会 马上 返回 ， 它 
不 必 等 待 达到 所 请 求 的 字 节 数 ( 本 例 中 为 MAXLINE)。 




















pipe/server.c 





1 #include "unpipc.h" 

2 void 

3 server(int readfd, int writefd) 

4 { 

5 int fd; 

6 ssize t n; 

7 char buff [MAXLINE+1] ; 

8 /* read pathname from IPC channel */ 

9 if ( (n = Read(readfd, buff, MAXLINE)) == 0) 

10 err quit("end-of-file while reading pathname") ; 

11 buff [n] = '\0'; /* null terminate pathname */ 
12 if ( (fd = open(buff, O RDONLY)) < 0) { 

13 /* error: must tell client */ 

14 snprintf (buff + n, sizeof (buff) - n, ": can't open, %s\n", 
15 strerror (errno) ); 

16 n = strlen(buff) ; 

T7 Write(writefd, buff, n); 

18 ) eise ( 

19 /* open succeeded: copy file to IPC channel */ 
20 while ( (n = Read(fd, buff, MAXLINE)) > 0) 

21 Write(writefd, buff, n); 

22 Close (fd); 

23 ) 

24 } 


pipe/server.c 





图 4-10 使 用 两 个 管道 的 客户 -服务 器 程序 server 函 数 


打开 文件 ， 处 理 错误 

12—17 ”打开 所 请 求 的 文件 来 谈 ， 知 出 错 则 通过 管道 返回 给 客户 一 
^P HRA AR. 240108] H strerror ek Zi LAI iio HAR, 
CUNPvVl 第 690 一 691 页 详细 讨论 了 strerror 函 数 [1] 。 

把 文件 复制 到 管道 

18—23 如 果 open 成 功 ， 就 将 该 文件 的 内 容 复制 到 管道 中 。 

下 面 的 例子 给 出 了 路 径 名 正确 及 发 生 错误 时 该 程序 的 输出 。 

solaris % mainpipe 

/etc/inet/ntp.conf 一 个 由 两 行文 本 构成 的 文 





件 
multicastclient 224.0.1.1 
driftfile /etc/inet/ntp.drift 


solaris % mainpipe 

/etc/shadow 一 个 我 们 不 能 读 的 文 
ft 

/etc/shadow: can't open,Permission denied 

solaris 96 mainpipe 

/no/such/file 一 个 不 存在 的 文件 

/no/such/file: can't open,No such file or directory 


4.4 全 双 工 管道 


上 一 节 中 我 们 提 到 ， 某 些 系 统 提 供 全 双 工 管道 : SVR4 的 pipe 函 数 以 
及 许多 内 核 都 提供 的 socketpair 函 数 。 那 么 全 双 工 管道 到 底 提 供 什 么 呢 ? 
首先 ， 我 们 可 以 如 图 4-11 所 示 考 虑 一 个 半 双 工 管道 ， 它 是 对 图 4-2 的 修 
改 ， 省 略 了 其 中 的 进程 。 


write read 






fa[1] 一 半 双 工 管道 一 fa[0] 


图 4-11 半 双 工 管道 
全 双 工 管道 可 能 实现 成 如 图 4-12 所 示 。 它 隐 售 的 意思 是 : 整个 管道 
只 存在 一 个 缓冲 区 ，“ 在 任意 一 个 描述 符 上 ) 写 入 管道 的 任何 数据 都 添 
加 到 该 缓冲 区 末尾 ，“【〔 在 任意 一 个 描述 符 上 〉 从 管道 读 出 的 都 是 取 目 该 
绥 冲 区 开头 的 数据 。 
















write 
fa[1] 全 双 工 管道 fato] 


图 4-12 全 双 工 管道 的 一 个 可 能 实现 (不 正确 ) 

















这 种 实现 所 存在 的 问题 在 像 图 A-29 这 样 的 程序 中 变 得 很 明显 。 我 们 


需要 双 疝 通信 ， 但 所 需 的 是 两 个 独立 的 数据 流 ， 每 个 方向 一 个 。 奢 不 是 
这 样 ， 当 一 个 进程 往 该 全 双 工 管道 写 入 数据 ， 过 后 再 对 该 管道 调用 read 
时 ， 有 可 能 读 回 刚 写 入 的 数据 。 

图 4-13 展 示 了 全 双 工 管道 的 真正 实现 。 











一 半 双 工 管道 ~ 
fart] 


一 半 双 工 管道 一 





图 4-13 全 双 工 管道 的 真正 实现 
这 儿 的 全 双 工 管道 是 由 两 个 半 双 工 管道 构成 的 。 写 入 fd[1] 的 数据 只 
能 从 fd[0] 读 出 ， 写 入 fd[0] 的 数据 只 能 从 fd[1] 读 出 。 
图 4-14 中 的 程序 表明 可 使 用 单个 全 双 工 管道 完成 双 同 通信 。 











pipe/fduplex.c 

1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fd[2], n; 

6 char C; 

T pid t childpid; 

8 Pipe (fd) ; /* assumes a full-duplex pipe (e.g., SVR4) */ 
9 if ( (childpid = Fork()) == 0) { /* child */ 
10 sleep (3) ; 

TI if ( (n = Read(fd[0O0], &c, 1)) != 1) 

42 err quit("child: read returned $d", n); 

q3 printf ("child read %c\n", c); 

14 Write(fd[0], "c", 1); 

15 exit (0); 

16 } 

17 /* parent */ 

18 Write (fd[1], "p", 1); 

19 if ( (n = Read(fd[1], &c, 1)) != 1) 
20 err quit("parent: read returned %d", n); 
21 printf("parent read %c\n", c); 
22 exit(0); 
23 } 


pipe/fduplex.c 





图 4-14 测试 全 双 工 管道 的 双向 通信 能 
我 们 创建 一 个 全 双 工 管道 后 调用 fork。 父 进程 往 该 管道 号 入 字符 p， 
然后 从 中 读 出 一 个 字符 。 子 进程 先 睡 眠 3 秒 ， 从 该 管道 读 出 一 个 字符 
后 ， 往 它 写 入 字符 c。 子 进程 中 的 睡眠 是 为 了 让 父 进 程 的 read 调 用 先 于 子 














进程 的 read 调 用 执行 ， 从 而 查看 父 进 程 是 侣 读 回 目 己 刚 写 的 字符 。 

在 提供 全 双 工 管道 的 Solaris ”2.6 下 运行 该 程序 ， 我 们 观察 到 了 所 期 
望 的 行为 。 

solaris % fduplex 

child read p 

parent read c 

字符 p 穿 越 图 4-13 中 所 示 顶 部 的 半 双 工 管道 ， 字 符 c 则 穿越 底部 的 半 
双 工 管道 。 父 进程 并 没有 读 回 自己 写 入 管道 的 数据 《字符 p) 。 

在 默认 提供 半 双 工 管道 的 Digital Unix 4.0B 下 运行 该 程序 ， 我 们 看 到 
了 半 双 工 管 道 的 预期 行为 。 编 译 时 如 果 指 定 不 同 的 选项 ， 那 它 也 能 像 
SVR4 那 样 提供 全 双 工 管道 。 

alpha 9% fduplex 











read error: Bad file number 

alpha % child read p 

write error: Bad file number 

父 进程 写 入 字符 p， 它 由 子 进程 读 出 ， 但 此 后 父 进 程 在 试图 从 fd[1] 
read 时 中 止 ， 子 进程 则 在 试图 往 fd[0] ”write 时 中 止 〈 回 想 图 4-11) 。 由 
read 返 回 的 错误 是 EBADF， 意 思 是 描述 符 fd[1] 不 是 打开 来 读 的 。 类 似 
地 ，write 返 回 同样 的 错误 ， 表 示 描 述 符 fd[1] 不 是 打开 来 号 的 。 


4.5 popen pclose pf Zi 
VEDA AAR BIN PIF, RENOAR HELE f popenre a, © 
创建 一 个 管道 并 局 动 另 外 一 个 进程 ， 访 进程 要 么 从 该 管道 读 出 标准 输 
和 入， 要么 往 该 管道 号 入 标准 输出 。 


#include <stdio.h> 








FILE *popen(const char *command,const char *type); 


返回 : 大 成 功 则 为 文件 指针 ， 大 出 错 则 为 NULL 
int pclose(FILE *stream); 
返回 : 大 成 功 则 为 shell 的 终止 状态 ， 知 出 错 则 为 -1 
其 中 command 是 一 个 shell 命 令 行 。 它 是 由 sh 程序 (通常 为 Bourmne 
shell) 处 理 的 ， 因 此 PATH 环境 变量 可 用 于 定位 command。popen 在 调用 
进程 和 所 指定 的 命令 之 间 创 建 一 个 管道 。 由 popen 返 回 的 值 是 一 个 标准 
VO _ FILE 指针， 该 指针 或 者 用 于 输入 ， 或 者 用 于 输出 ， 具 体 取 决 于 字符 
串 type。 
如 果 type 为 r， 那 么 调用 进程 读 进 command 的 标准 输出 。 
如 果 type 为 w， 那 么 调用 进程 写 到 command 的 标准 输入 。 
pclose 函 数 关 闭 由 popen 创 建 的 标准 WO 流 (stream) ， 等 竺 其 中 的 命 
令 终止 ， 然 后 返回 shell 的 终止 状态 。 
APUE 的 14.3 节 [2] 提供 了 popen 和 pclose 的 一 个 实现 。 
例子 
图 4-15 给 出 了 我 们 的 客户 -服务 器 例子 的 男 一 个 实现 ， 它 使 用 popen 
函数 和 Unix 的 cat 程 序 。8 一 17 ” 跟 图 4-9 一 样 ， 路 径 名 从 标准 输入 读 出 。 
随后 构建 一 个 命令 并 把 它 传 递 给 popen。 来 自 shell 或 cat 程 序 的 输出 被 复 
制 到 标准 输出 。 


pipe/mainpopen.c 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 size t n; 

6 char buff [MAXLINE] , command [MAXLINE] ; 

7 FILE *fp; 

8 /* read pathname */ 

9 Fgets (buff, MAXLINE, stdin); 

10 n = strlen(buff); /* fgets() guarantees null byte at end */ 
11 if (buff[n-1] == "\n’') 

t2 n--; /* delete newline from fgets() */ 
13 snprintf (command, sizeof(command), "cat %s", buff); 

14 fp = Popen(command, "r"); 

15 /* copy from pipe to standard output */ 

16 while (Fgets(buff, MAXLINE, fp) !- NULL) 

Iy Fputs (buff, stdout); 

18 Pclose (fp); 

19 exit (0); 


pipe/mainpopen.c 





图 4-15 使 用 popen 的 客户 -服务 器 程序 

这 个 实现 与 图 4-8 中 的 实现 的 差别 之 一 是 : 现在 我 们 依赖 于 由 系统 
的 cat 程 序 产生 的 出 错 消息 ， 而 这 些 消息 往往 不 足以 说 明 有 具体 错误 。 例 如 
在 Solaris ”2.6 下 ， 当 试图 读 一 个 我 们 没有 读 权 限 的 文件 时 ， 将 得 到 如 下 
的 错误 : 

solaris % cat /etc/shadow 

cat: cannot open /etc/shadow 

但 是 在 BSD/OS 3.1 下 ， 当 试图 读 一 下 类 似 的 文件 时 ， 将 得 到 一 个 更 
TERT PATERE VT Ie 

bsdi 96 cat /etc/master.passwd 

cat: /etc/master.passwd: cannot open [Permission denied] 

还 要 认识 到 在 上 面 的 例子 中 ，popen 调 用 是 成 功 的 ， 但 是 其 后 的 
fgets 只 是 在 首次 被 调用 时 返回 一 个 文件 结束 符 。cat 程 序 将 它 的 出 错 消 忆 
写 到 标准 错误 输出 ， 但 popen 不 对 标准 错误 输出 作 任 何 特殊 的 处 理 一 一 
只 有 标准 输出 才 被 重 定 向 到 由 它 创 建 的 管道 。 


4.6 FIFO 





管道 没有 名 字 ， 因 此 它们 的 最 大 劣势 是 只 能 用 于 有 一 个 共同 祖先 进 
程 的 各 个 进程 之 间 。 我 们 无 法 在 无 亲缘 关系 的 两 个 进程 间 创 建 一 个 管道 
并 将 它 用 作 IPC 通 道 (不 考虑 描述 符 传递) 。 

FIFO 指 代 先 进 先 出 (first in, first out) ，Unix 中 的 FIFO 类 似 于 管 
道 。 它 是 一 个 单 癌 〈 半 双 工 ) 数据 流 。 不 同 于 管道 的 是 ， 每 个 FIFO 有 一 
个 路 径 名 与 之 关联 ， 从 而 允许 无 亲缘 关系 的 进程 访问 同一 个 FIFO。 
FIFO 也 称 为 有 名 管道 (named pipe) 。 

FIFO 由 mkfifo 函 数 创建 。 

#include <sys/types.h> 


#include <sys/stat.h> 








int mkfifo(const char *pathname,mode_t mode); 
返回 : 知 成 功 则 为 0， 知 出 错 则 为 -1 

其 中 pathname 是 一 个 普通 的 Unix 路 径 名 ， 它 是 该 FIFO 的 名 字 。 

mode 参 数 指定 文件 权限 位 ， 类 似 于 open 的 第 二 个 参数 。 图 2-4 给 出 
了 定义 在 <sys/stat.h> 头 文件 中 的 6 个 常 值 ， 用 于 给 一 个 FIFO 指 定 权 限 
位 。 

mkfifo 函 数 已 隐 含 指定 OCREAT | O_EXCL。 也 就 是 说 ， 它 要 么 创 
建 一 个 新 的 FIFO， 要 么 返回 一 个 EEXIST 错 误 〈 如 果 所 指定 名 字 的 FIFO 
CATE) 。 如 果 不 希 望 创建 一 个 新 的 FIFO， 那 就 改 为 调用 open 而 不 是 
mkfifo。 要 打开 一 个 已 存在 的 FIFO 或 创建 一 个 新 的 FIFO， 应 先 调用 
mkfifo， 再 检查 它 是 否 返 回 FEXIST 错 误 ， 若 返回 该 错误 则 改 为 调用 
open. 

mkfifo 命 令 也 能 创建 FIFO。 可 以 从 shell 脚 本 或 命令 行 中 使 用 它 。 

在 创建 出 一 个 FIFO 后 ， 它 必须 或 者 打开 来 读 ， 或 者 打开 来 写 ， 所 用 
的 可 以 是 open 函 数 ， 也 可 以 是 某 个 标准 MO 打开 函数 ， 例 如 fopen。FIFO 








不 能 打开 来 既 读 又 写 ， 因 为 它 是 半 双 工 的 。 

对 管道 或 FIFO 的 write 总 是 往 末 尾 添加 数据 ， 对 它们 的 read 则 总 是 从 
开头 返回 数据 。 如 果 对 管道 或 FIFO 调 用 lseek， 那 就 返回 ESPIPE 错 误 。 

4.6.1 例子 

现在 重新 编写 图 4-8 中 的 客户 -服务 器 程序 ， 这 次 改 用 两 个 FIFO 代 葵 
两 个 管道 。dlient 和 server 函 数 保持 不 变 ， 所 有 变动 都 在 main 函 数 上 ， 它 
如 图 4-16 所 示 。 

创建 两 个 FIFO 

10~16 在 /mp 文件 系统 中 创建 两 个 FIFO。 这 两 个 FIFO 事 先 存 在 与 
否 无 关 紧 要 。 常 值 FILE_MODE 在 我 们 的 unpipc.h 头 文件 (图 C-1〉 中 定 
SHIT F 

#define FILE MODE (S IRUSR|S IWUSR|S IRGRP|S IROTH) 

/* default permissions for new files */ 

这 允许 用 户 读 、 用 户 写 、 组 成 员 读 和 其 他 用 户 读 。 这 些 权限 位 会 被 
当前 进程 的 文件 模式 创建 掩 码 修正 。 

fork 

17~27 调用 fork 后 ， 子 进程 调用 我 们 的 server 函 数 〈 图 4-10) ， 父 进 
程 调 用 我 们 的 client 函 数 〈 图 4-9) 。 在 执行 这 些 调用 前 ， 父 进程 打开 第 
一 个 FIFO 来 号 ， 打 开 第 二 个 FIFO 来 读 ， 子 进程 打开 第 一 个 FIFO 来 读 ， 
打开 第 二 个 FIFO 来 写 。 这 与 我 们 的 管道 例子 类 似 ， 图 4-17 展 示 了 这 个 布 
局 。 

这 个 FIFO 例 子 比 起 之 前 的 管道 例子 变动 如 下 。 

创建 并 打开 一 个 管道 只 需 调 用 pipe。 创 建 并 打开 一 个 FIFO 则 需 在 调 
用 mkfifo 后 再 调用 open。 

管道 在 所 有 进程 最 终 都 关闭 它 之 后 目 动 消失 。FIFO 的 名 字 则 只 有 通 
过 调用 unlink 才 从 文件 系统 中 删除 。 

FIFO 需 要 额外 调用 的 好 处 是 : FIFO 在 文件 系统 中 有 一 个 名 字 ， 该 








名 字 人 允许 某 个 进程 创建 一 个 FIFO， 与 它 无 亲缘 关系 的 另 一 个 进程 来 打开 
这 个 FIFO。 对 于 管道 来 说 ， 这 是 不 可 能 的 。 





pipe/mainfifo.c 
1 #include "unpipc.h" 


2 #define FIFO1 "/tmp/fifo.1" 
3 #define FIFO2 "/tmp/fifo.2" 


4 void client(int, int), server(int, int); 
5 dnt 
6 main(int argc, char **argv) 
$4 
8 int readfd, writefd; 
9 pid t childpid; 
10 /* create two FIFOs; OK if they already exist */ 
TL if ((mkfifo(FIFOL1, FILE MODE) « 0) && (errno !- EEXIST)) 
12 err sys("can't create %s", FIFO1); 
13 if ((mkfifo(FIFO2, FILE MODE) « 0) && (errno !- EEXIST)) ( 
14 unlink (FIFO1) ; 
15 err_sys("can't create %s", FIFO2); 
16 } 
17 if ( (childpid = Fork()) == 0) { /* child */ 
18 readfd = Open(FIFO1, O RDONLY, 0); 
19 writefd = Open(FIFO2, O WRONLY, 0); 
20 server (readfd, writefd) ; 
21 exit (0); 
22 ) 
23 /* parent */ 
24 writefd = Open(FIFO1, O WRONLY, 0); 
25 readfd = Open(FIFO2, O RDONLY, 0); 
26 client(readfd, writefd); 
27 Waitpid(childpid, NULL, 0); /* wait for child to terminate */ 
28 Close (readfd) ; 
29 Close (writefd) ; 
30 Unlink (FIFO1) ; 
za Unlink (FIFO2) ; 
32 exit (0); 
33 | 


pipe/mainfifo.c 





图 4-16 使 用 两 个 FIFO 的 客户 -服务 器 程序 main 函 数 





父 进程 





/tmp/fifo.1 











一 数据 流 一 
/tmp/fifo.2 






一 数据 流 一 
图 4-17 使 用 两 个 FIFO 的 客户 -服务 器 例子 
没有 正确 使 用 FIFO 的 程序 会 发 生 微妙 的 问题 。 考 虑 图 4-16: 如 果 我 
们 对 换 父 进程 中 两 个 open 调 用 的 顺序 ， 该 程序 就 不 工作 。 其 原因 在 于 ， 
如 果 当 前 尚 没有 任何 进程 打开 某 个 FIFO 来 写 ， 那 么 打开 该 FIFO 来 读 的 
进程 将 阻塞 。 对 换 父 进程 中 两 个 open 调 用 的 顺序 后 ， 父 子 进程 将 都 打开 








同一 个 FIFO 来 读 ， 然 而 当时 并 没有 任何 进程 已 打开 该 文件 来 写 ， 于 是 父 
子 进程 都 阻塞 。 这 种 现象 称 为 死 锁 〈deadlock) 。 我 们 将 在 下 一 节 讨论 
这 种 情形 。 

4.6.2 例子 : 无 亲缘 关系 的 客户 与 服务 器 

图 4-16 中 客户 和 服务 器 仍然 是 有 亲缘 关系 的 进程 。 不 过 我 们 可 以 把 
这 个 例子 重新 编写 成 客户 与 服务 器 无 杀 缘 关系 的 状态 。 图 4-18 给 出 了 服 
务 器 程序 ， 它 与 图 4-16 的 服务 器 部 分 差不多 一 样 。 





pipe/server_main.c 


1 #include "ETEO. At 
2 void server(int, int); 
3 int 


4 main(int argc, char **argv) 


5 { 


6 int readfd, writefd; 

7 /* create two FIFOs; OK if they already exist */ 

8 if ((mkfifo(FIFO1, FILE MODE) < 0) && (errno != EEXIST) ) 
9 err sys("can't create %s", FIFO1); 

10 if ((mkfifo(FIFO2, FILE MODE) « 0) && (errno !- EEXIST)) ( 
T unlink (FIFO1) ; 

12 err_sys("can't create %s", FIFO2) ; 

13 } 

14 readfd = Open(FIFO1, O RDONLY, 0); 

15 writefd = Open(FIFO2, O WRONLY, 0); 

16 server(readfd, writefd) ; 

T7 exit (0); 

18 } 





pipe/server main.c 


图 4-18 独立 服务 器 程序 main 函 数 


头 文 件 fifo.h 如 图 4-19 所 示 ， 它 提供 了 程序 中 两 个 FIFO 名 字 的 定义 ， 
客户 和 服务 器 都 得 知道 它们 。 








pipe/fifo.h 
1 include "unpipc.h" 
2 #define  FIFO1 "/tmp/fifo.1" 
3 #define FIFO2 "/tmp/fifo.2" 

pipe/fifo.h 


图 4-19 客户 程序 和 服务 器 程序 都 包含 的 fifo.h 头 文件 

图 4-20 给 出 了 客户 程序 ， 它 与 图 4-16 的 客户 部 分 差不多 一 样 。 注 意 
最 后 删除 所 用 FIFoO 的 是 客户 而 不 是 服务 器 ， 因 为 对 这 些 FIFO 执 行 最 终 
操作 的 是 客户 。 

内 核 为 管道 和 FIFO 维 护 一 个 访问 计数 器 ， 它 的 值 是 访问 同一 个 管道 
或 FIFO 的 打开 着 的 描述 符 的 个 数 。 有 了 访问 计数 器 后 ， 客 户 或 服务 器 就 
能 成 功 地 调用 unlink。 尽 管 该 函数 从 文件 系统 中 删除 了 所 指定 的 路 径 
名 ， 先 前 已 经 打开 该 路 径 名 、 目 前 仍 打开 着 的 描述 符 却 不 受 影响 。 

然而 对 于 其 他 形式 的 IPC 来 说 〈 例 如 System | VILIA VI). ， 这 样 的 











计数 器 并 不 存在 ， 因 此 要 是 服务 器 在 癌 某 个 消 妃 队列 写 入 目 己 的 最 终 消 
县 后 删除 了 该 队列 ， 那 么 当 客 户 答 试 读 出 这 个 最 终 消息 时 ， 该 队列 可 能 
己 消失 了 。 


pipe/client_main.c 





1 #include ki 
2 void client (int, int); 
3 dnt 


4 main(int argc, char **argv) 
5 { 


6 int readfd, writefd; 

7 writefd = Open(FIFO1, O WRONLY, 0); 
8 readfd = Open(FIFO2, O RDONLY, 0); 
9 client(readfd, writefd) ; 

10 Close (readfd); 

TI Close (writefd) ; 

12 Unlink (FIFO1) ; 

13 Unlink (FIFO2) ; 

14 exit (0) ; 

15 } 


pipe/client_main.c 








图 4-20 独立 客户 程序 main 函 数 

为 运行 这 对 客户 和 服务 器 ， 先 在 后 台 局 动 服务 器 : 

% server file & 

再 局 动 客 户 。 另 一 种 办 法 是 只 局 动 客 户 ， 服 务 器 则 由 客户 通过 调用 
fork 和 exec 来 激活 。 客 户 还 可 以 把 所 用 的 两 个 FIFO 的 名 字 作 为 命令 行 参 
数 通 过 exec 函 数 传递 给 服务 器 ， 从 而 不 必 将 它们 编写 到 一 个 头 文件 中 。 
不 过 这 种 情形 会 使 得 服务 器 成 为 客户 的 一 个 子 进程 ， 这 么 一 来 管道 就 够 
HT. 











4.7 管道 和 EIFO 的 额外 属性 


我 们 需要 就 管道 和 FIFO 的 打开 、 读 出 和 写 入 更 为 详细 地 描述 它们 的 
某 些 属性 。 首 先 ， 一 个 描述 符 能 以 两 种 方式 设置 成 非 阻塞 。 
(1) 调 用 open 时 可 指定 O_NONBLOCK 标 志 。 例 如 图 4-20 中 第 一 个 


open 调 用 可 以 是 : 

writefd = Open(FIFO1,0_WRONLY | O NONBLOCK,0); 

(2) 如 果 一 个 描述 符 已 经 打开 ， 那 么 可 以 调用 fcnt 以 月 用 
O_NONBLOCK 标 志 。 对 于 管道 来 次， 必须 使 用 这 种 技术 ， 因 为 管道 没 
有 open 调 用 ， 在 pipe 调 用 中 也 无 法 指定 O_NONBLOCK 标 志 。 使 用 fentl 
时 ， 我 们 先 使 用 F_GETFL 命 令 取得 当前 文件 状态 标志 ， 将 它 与 
O_NONBLOCK 标 志 按 位 或 后 ， 再 使 用 F_SETFL 命 令 存 储 这 些 文件 状态 
标志 : 

int flags; 

if ( (flags = fcntl(fd,F GETFL,0))« 0) 

err sys("F GETFL error"); 
flags |= O NONBLOCK; 

if (fcntl(fd,F SETFL,flags)« 0) 

err sys("F SETFL error"); 

留心 你 可 能 会 碰 到 的 简单 地 设置 所 需 标 志 的 代码 ， 因 为 这 样 的 代码 
在 设置 所 需 标 志 的 同时 清除 了 所 有 其 他 可 能 存在 的 文件 状态 标志 : 

/* wrong way to set nonblocking */ 

if (fentl(fd,F_SETFL,O_NONBLOCK)< 0) 

err sys("F SETFL error"); 
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或 空 FIFO 读 出 数据 的 影响 以 及 对 往 一 个 管道 或 FIFO 写 入 数据 的 影响 。 
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当前 操作 (eR EE MEN 
现 有 打开 操作 UAE OBRA BLED O_NONBLOCK 设 置 
open FIFO FIFO 打 开 来 写 成 功 返 回 成 功 返 回 
A FIFO 不 是 打开 来 写 阻塞 到 FIFO 打 开 来 写 为 止 成 功 返 回 
open FIFO FIFO 打 开 来 读 成 功 返 回 成 功 返 回 
iin FIFO 不 是 打开 来 读 阻塞 到 FIFO 打 开 来 读 为 返回 ENXIO 错 误 
从 空 管道 或 | 管道 或 FIFO 打 开 来 写 阻塞 到 管道 或 FIFO 中 有 数据 或 者 | 返回 EAGAIN 错 误 
geen 管道 或 FIFO 不 再 为 写 打开 着 为 止 
“FIFO read aaa — =a = : T = — 
管道 或 FIFO 不 是 打开 来 写 read 返 回 0 (文件 结束 符 ) read 返 回 0 (文件 结束 符 ) 
往 管道 或 | 管道 或 FIFO 打 开 来 读 ( 见 正文 ) ( 见 正文 ) 
FIFO write 管道 或 FIFO 不 是 打开 来 读 给 线程 产生 SsIGPIPE 给 线程 产生 SsIGPIPE 





图 4-21 O_NONBLOCK 标 志 对 管道 和 FIFO 的 影响 

下 面 是 关于 管道 或 FIFO 的 读 出 与 写 入 的 知 干 额外 规则 。 

如 果 请 求 读 出 的 数据 量 多 于 管道 或 FIFO 中 当前 可 用 数据 量 ， 那 么 只 
返回 这 些 可 用 的 数据 。 我 们 必须 准备 好 处 理 来 自 read 的 小 于 所 请 求 数目 
的 返回 值 。 

如 果 请 求 写 入 的 数据 的 字 节 数 小 于 或 等 于 PIPE_BUF (一 个 Posix 限 
制 值 ， 将 在 4.11 节 详细 讨论 ) ， 那 么 write 操作 保证 是 原子 的 。 这 意味 
着 ， 如 果 有 两 个 进程 差不多 同时 往 同一 个 管道 或 FIFO 写 ， 那 么 或 者 先 写 
入 来 自 第 一 个 进程 的 所 有 数据 ， 再 写 入 来 自 第 二 个 进程 的 所 有 数据 ， 或 
者 颠倒 过 来 。 系 统 不 会 相互 混杂 来 自 这 两 个 进程 的 数据 。 然 而 ， 如 有 果 请 
求 写 入 的 数据 的 字 节 数 大 于 PIPE_BUF， 那 么 write 操 作 不 能 保证 是 原子 
的 。 

Posix.1 要 求 PIPE_BUF 人 至 少 为 512 字 节 。 常 见 的 值 处 于 从 BSD/0S 3.1 
的 1024 到 Solaris 2.6 的 5120 之 间 。4.11 节 有 一 个 程序 可 输出 这 个 值 。 

O_NONBLOCK 标 志 的 设置 对 write 操 作 的 原子 性 没有 影响 一 一 原子 
性 完全 是 由 所 请 求 字 节 数 是 否 小 于 等 于 PIPE_BUF 决 定 的 。 然 而 当 一 个 
管道 或 FIFO 设 置 成 非 阻塞 时 ， 来 自 write 的 返回 值 取 决 于 待 写 的 字 节 数 
以 及 该 管道 或 FIFO 中 当前 可 用 空间 的 大 小 。 如 果 待 写 的 字 节 数 小 于 等 于 
PIPE BUF: 

















a. 如 果 该 管道 或 FIFO 中 有 足以 存放 所 请 求 字 贡 数 的 空间 ， 那 么 所 有 
数据 字 节 都 写 入 。 

b. 如 果 该 管道 或 FIFO 中 没有 足以 存放 所 请 求 字 市 数 的 空间 ， 那 么 江 
即 返 回 一 个 EAGAIN 错 误 。 既 然 设 置 了 O_NONBLOCK 标 志 ， 调 用 进程 
就 不 希望 自己 被 投入 睡眠 中 。 但 是 内 核 无 法 在 接受 部 分 数据 的 同时 仍 保 
证 write 操作 的 原子 性 ， 于 是 它 必 须 返 回 一 个 错误 ， 告 诉 调用 进程 以 后 再 
ik. 

WR FS BK TF PIPE_BUF: 

a. 如 果 该 管道 或 FIFO 中 至 少 有 1 字 节 空间， 那么 内 核 写 入 该 管道 或 
FIFO 能 容纳 数目 的 数据 字 节 ， 该 数目 同时 作为 来 自 write 的 返回 值 。 

b. 如 果 该 管道 或 FIFO 已 满 ， 那 么 立即 返回 一 个 EAGAIN 错 误 。 

如 果 癌 一 个 没有 为 读 打 开 着 的 管道 或 FIFO 写 入 ， 那 么 内 核 将 产生 一 
个 SIGPIPE 信 号 : a. 如 果 调 用 进程 既 没 有 捕获 也 没有 忽略 该 SIGPIPE 信 
号 ， 所 采取 的 默认 行为 就 是 终止 该 进程 。 

b. 如 果 调 用 进程 忽略 了 该 SIGPIPE 信 号 ， 或 者 捕获 了 该 信号 并 从 其 
音 号 处 理 程 序 中 返回 ， 那 么 write 返回 一 个 EPIPE 错 误 。 

SIGPIPE 被 认为 是 一 个 同步 信号 ， 也 就 是 说 ， 这 是 一 个 由 特定 的 线 
FE (调用 write 的 线程 》 引 起 的 信号 。 然 而 处 理 这 个 信号 最 容易 的 办 法 是 
忽略 它 〈 把 它 的 处 理 办 法 设置 成 SIG-IGN) ， 让 write 返回 一 个 EPIPE 错 
误 。 应 用 程序 应 该 无 遗漏 地 检测 由 write 返回 的 错误 ， 而 检测 某 个 进程 被 
SIGPIPE 终 止 却 困难 得 多 。 如 果 该 信号 未 被 捕获 ， 我 们 就 得 从 shell 中 得 
看 被 终止 进程 的 终止 状态 ， 以 确定 该 进程 是 否 被 某 个 信号 所 杀 死 以 及 具 
体 是 被 哪个 信号 杀 死 的 。UNPvl 的 5.13 节 详细 讨论 SIGPIPE。 


4.8 单个 服务 器 ， 多 个 客户 


FIFO 的 真正 优势 表现 在 服务 器 可 以 是 一 个 长 期 运行 的 进程 (例如 守 














护 进程 ， 如 UNPvl 第 12 章 所 述 ) ， 而 且 与 其 客户 可 以 无 亲缘 关系 。 作 为 
服务 器 的 守护 进程 以 某 个 众所周知 的 路 径 名 创建 一 个 FIFO， 并 打开 该 
FIFO 来 读 。 此 后 某 个 时 刻 局 动 的 客户 打开 该 FIFO 来 写 ， 并 将 其 命令 或 
给 守护 进程 的 其 他 任何 东西 通过 该 FIFO 发 送出 去 。 使 用 FIFO 很 容易 实 
现 这 种 形式 的 单 向 通信 《从 客户 到 服务 器 ) ， 但 是 如 果 守 护 进 程 需要 问 
客户 发 送 回 一 些 东 西 ， 事 情 就 困难 了 。 图 4-22 是 我 们 随 例子 使 用 的 技 

1j, 







服务 器 


文件 内 容 


PID， 路 径 名 


PID 1234 PID 9876 
图 4-22 单个 服务 器 ， 多 个 客户 


服务 器 以 一 个 众所周知 的 路 径 名 本 例 中 为 /tmp/fifo.serv〉 创 建 一 





个 FIFO， 它 将 从 这 个 FIFO 读 入 客户 的 请 求 。 每 个 客户 在 启动 时 创建 自 
己 的 FIFO， 所 用 的 路 径 名 含有 自己 的 进程 ID。 每 个 客户 把 自己 的 请 求 
写 入 服务 器 的 众所周知 FIFO 中 ， 该 请 求 含 有 客户 的 进程 ID 以 及 一 个 路 
径 名 ， 有 具有 该 路 径 名 的 文件 就 是 客户 希望 服务 器 打开 并 发 回 的 文件 。 
图 4-23 给 出 了 服务 器 程序 。 
创建 众所周知 FIFO， 打 开 来 读 ， 打 开 来 写 











10~15 ”创建 服务 器 的 众所周知 FIFO， 就 算 它 已 经 存在 也 没 问 题 。 
接着 打开 该 管道 两 次 ， 一 次 只 读 ， 一 次 只 写 。readfifo 描 述 符 用 于 读 出 到 
达 该 FIFO 的 每 个 客户 请 求 ，dummyfd 描 述 符 则 从 来 不 用 。 打 开 该 FIFO 
来 写 的 原因 可 从 图 4-21 中 看 出 。 要 是 我 们 不 这 么 做 ， 那 么 每 当 有 一 个 客 
户 终止 时 ， 该 FHIFO 就 变 空 ， 于 是 服务 器 的 read 返 回 0， 表 示 是 一 个 文件 
结束 符 。 我 们 将 不 得 不 close 该 FIFO， 并 以 O_RDONLY 标 志 再 次 调用 
open， 不 过 该 调用 会 一 直 阻 窄 到 下 一 个 客户 请 求 到 达 为 止 。 然 而 如 果 我 
们 总 是 有 一 个 该 FIFO 的 描述 符 打 开 着 用 于 写 ， 那 么 当 不 再 有 客户 存在 
时 ， 服 务 器 的 read 一 定 不 会 返回 0 以 指示 读 到 一 个 文件 结束 符 。 相 反 ， 
服务 器 只 是 阻塞 在 read 调 用 中 ， 等 待 下 一 个 客户 请 求 。 于 是 这 个 技巧 简 
化 了 我 们 的 服务 器 代码 ， 减 少 了 为 其 众所周知 FIFO 调 用 open 的 次 数 。 








fifocliserv/mainserver.c 


1 #include "fifo.h" 
2 void server(int, int); 
3. int 
4 main(int argc, char **argv) 
5 ( 
6 int readfifo, writefifo, dummyfd, fd; 
7 char *ptr, buff [MAXLINE+1], fifoname [MAXLINE] ; 
8 pid t pid; 
9 ssize t n; 
10 /* create server's well-known FIFO; OK if already exists */ 
TL if ((mkfifo(SERV FIFO, FILE MODE) « 0) && (errno !- EEXIST)) 
12 err sys("can't create $s", SERV FIFO); 
13 /* open server's well-known FIFO for reading and writing */ 
14 readfifo - Open(SERV FIFO, O RDONLY, 0); 
15 dummyfd - Open(SERV FIFO, O WRONLY, 0); /* never used */ 
16 while ( (n = Readline(readfifo, buff, MAXLINE)) > 0) { 
TT if (buff[n-1] == '\n') 
18 n--; /* delete newline from readline() */ 
19 búff [n] = '\0'; /* null terminate pathname */ 
20 if ( (ptr = strchr(buff, ' ')) == NULL) { 
21 err msg("bogus request: %s", buff); 
22 continue; 
23 ) 
24 *ptr++ = 0; /* null terminate PID, ptr = pathname */ 
25 pid = atol (buff) ; 
26 snprintf(fifoname, sizeof (fifoname), "/tmp/fifo.%ld", (long) pid); 
27 if ( (writefifo = open(fifoname, O WRONLY, 0)) < 0) { 
28 err msg("cannot open: $s", fifoname) ; 
29 continue; 
30 ) 
31 if ( (fd = open(ptr, O RDONLY)) < 0) { 
32 /* error: must tell client */ 
393 snprintf (buff + n, sizeof (buff) - n, ": can't open, %s\n", 
34 strerror(errno)); 
35 n = strlen(ptr); 
36 Write(writefifo, ptr, n); 
37 Close(writefifo); 
38 ) eise { 
39 /* open succeeded: copy file to FIFO */ 
40 while ( (n = Read(fd, buff, MAXLINE)) > 0) 
41 Write(writefifo, buff, n); 
42 Close(fd); 
43 Close (writefifo); 
44 ) 
45 ) 
46 exit(0); 
47 ) 


fifocliserv/mainserver.c 




















图 4-23 处 理 多 个 客户 请 求 的 FIFO 服 务 器 程序 


服务 器 启动 时 ， 它 的 第 一 个 open (使 用 O_RDONLY 标 志 ) 将 阻塞 
到 第 一 个 客户 只 写 打 开 服 务 器 的 FIFO 为 止 〈 回 想 图 4-21) 。 它 的 第 二 个 





open 〈 使 用 O_WRONLY 标 志 ) 则 立即 返回 ， 因 为 该 FIFO 已 经 打开 着 用 
TEILT. 

读 出 客户 请 求 

16 每 个 客户 请 求 是 由 进程 ID、 一 个 空格 再 加 路 径 名 构成 的 单行 。 
我 们 使 用 自己 的 readline 函 数 〈 见 UNPvl 第 79 页 ) 。 

分 析 客 户 请 求 

17~26 删除 通常 由 readline 返 回 的 换行 符 。 该 换行 符 只 有 在 这 样 两 
种 情况 下 才 会 拉 掉 : 过 到 它 之 前 缓冲 区 已 填 满 ， 或 者 输入 的 最 后 一 行 不 
是 以 换行 符 终 止 。 由 strchr 函 数 返回 的 赋 给 ptr 的 指针 指向 客户 请 求 行 中 
的 空格 ，ptr 增 1 后 即 指向 后 跟 的 路 径 名 的 首 字符 。 客 户 的 FIFO 的 路 径 名 
是 根据 其 进程 ID 构造 的 ， 服 务 器 以 只 写 的 方式 打开 该 FIFO。 

打开 客户 请 求 的 文件 ， 将 它 发 送 到 客户 的 FIFO 

27~44 ”服务 器 的 剩余 部 分 类 似 于 图 4-10 中 的 server 函 数 。 它 打开 客 
户 请 求 的 文件 ， 若 失败 则 通过 客户 的 FIFO 向 客户 返回 一 个 出 错 消息 。 若 
open 成 功 则 把 文件 的 内 容 复 制 到 客户 的 FIFO 中 。 完 成 后 close 客 户 的 
FIFO 的 服务 器 端 ， 以 使 得 客户 的 read 返 回 0 (文件 结束 符 ) 。 服 务 器 不 
删除 客户 的 FIFO， 这 个 工作 由 客户 在 读 出 来 自 服务 器 的 文件 结束 符 后 完 
成 。 

客户 程序 在 图 4-24 中 给 出 。 





fifocliserv/mainclient.c 





1 #include "tito" 

2: ‘ane 

3 main(int argc, char **argv) 

* 4 

5 int readfifo, writefifo; 

6 Size t len; 

7 ssize t n; 

8 char *ptr, fifoname [MAXLINE], buff [MAXLINE] ; 

9 pid t pid; 

10 /* create FIFO with our PID as part of name */ 

T pid = getpid(); 

12 snprintf(fifoname, sizeof(fifoname), "/tmp/fifo.$1d", (long) pid); 
13 if ((mkfifo(fifoname, FILE MODE) « 0) && (errno !- EEXIST)) 

14 err sys("can't create $s", fifoname); 

15 /* start buffer with pid and a blank */ 

16 snprintf (buff, sizeof (buff), "$1d ", (long) pid); 

Bu) len = strlen(buff); 

18 ptr = buff + len; 

19 /* read pathname */ 

20 Fgets(ptr, MAXLINE - len, stdin); 

21 len = strlen (buff); /* fgets() guarantees null byte at end */ 
22 /* open FIFO to server and write PID and pathname to FIFO */ 
23 writefifo = Open (SERV_FIFO, O_WRONLY, 0); 

24 Write (writefifo, buff, len); 

25 /* now open our FIFO; blocks until server opens for writing */ 
26 readfifo = Open(fifoname, O_RDONLY, 0); 

27 /* read from IPC, write to standard output */ 

28 while ( (n = Read(readfifo, buff, MAXLINE)) > 0) 

29 Write (STDOUT_FILENO, buff, n); 

30 Close (readfifo); 

31 Unlink(fifoname); 

32 exit(0); 

33 ) 


fifocliserv/mainclient.c 





图 4-24 与 图 4-23 中 服务 器 程序 协同 工作 的 客户 程序 





创建 FIFO 

10—14 客户 的 FIFO 是 使 用 以 进程 ID 作为 其 最 后 一 部 分 的 路 径 名 创 
建 的 。 

构建 客户 请 求 行 

15—21 客户 的 请 求 由 其 进程 ID、 一 个 空格 、 一 个 路 径 名 和 一 个 换 
行 符 构成 ， 其 中 的 路 径 名 指 代 请 求 服务 器 发 送 给 本 客户 的 文件 。 这 个 请 
求 行 在 字符 数组 buff 中 构建 ， 路 径 名 则 从 标准 输入 读 入 。 

打开 服务 器 的 FIFO， 写 入 请 求 

22—24 ”打开 服务 器 的 FIFO 后 往 其 中 写 入 请 求 。 如 果 本 客户 是 自 服 
务 器 启动 以 来 第 一 个 打开 该 FIFO 的 客户 ， 那 么 这 儿 的 open 将 把 服务 器 从 





它 的 open 调 用 (使 用 O_RDONLY 标 志 ) 中 解 阻 塞 出 来 。 

该 出 来 自 服务 器 的 文件 内 容 或 出 错 消 奶 

25~31 ”从 本 客户 的 FIFO 中 读 出 服务 器 的 应 答 ， 并 写 到 标准 输出 。 
随后 关闭 并 删除 该 FIFO。 

我 们 可 以 在 一 个 窗口 中 启动 服务 器 ， 在 男 一 个 窗口 中 运行 客户 ， 它 
们 将 如 期 地 工作 。 下 面 给 出 的 只 是 客户 的 交互 例子 。 

solaris % mainclient 

/etc/shadow 一 个 我 们 不 能 
读 的 文件 


/etc/shadow: can't open,Permission denied 





solaris % mainclient 

/etc/inet/ntp.conf 一 个 由 2 行文 本 构 
成 的 文件 

multicastclient 224.0.1.1 

driftfile /etc/inet/ntp.drift 

我 们 还 可 以 从 shell 中 与 服务 器 交互 ， 因 为 FIFO 在 文件 系统 中 有 名 





子 。 
solaris % Pid=$$ 本 shell 的 进程 ID 
solaris % mkfifo /tmp/fifo.$Pid 创建 客户 的 FIFO 
solaris % echo "$Pid /etc/inet/ntp.conf" > /tmp/fifo.serv 
solaris % cat < /tmp/fifo.$Pid 该 出 服务 器 的 应 答 


multicastclient 224.0.1.1 

driftfile /etc/inet/ntp.drift 

solaris 96 rm /tmp/fifo.$Pid 

我 们 用 一 个 shell 命 令 Cecho) E% CAshelD 的 进程 ID 和 所 请 求 
的 路 径 名 发 送 给 服务 器 ， 用 另 一 个 命令 〈cat) BEM IRS aS AY AS XX 
个 命令 之 间 可 相隔 任意 长 度 的 时 间 。 这 么 一 来 ， 表 面 上 看 先 由 服务 器 往 





客户 的 FIFO 中 写 文 件 ， 再 由 客户 执行 cat 命 令 从 该 FIFO 中 读 出 数据 ， 这 
样 的 表象 可 能 会 使 我 们 认为 即使 没有 进程 打开 着 客户 的 FIFO， 数 据 也 会 
以 某 种 方式 存留 于 该 FIFO 中 。 但 事情 并 不 是 这 样 ， 真 正 的 规则 是 : 当 对 
一 个 管道 或 FIFO 的 最 终 close 发 生 时 ， 该 管道 或 FIFO 中 的 任何 残余 数据 
都 被 丢弃 。 在 我 们 的 shel] 例 子 中 ， 服 务 器 读 出 客户 的 请 求 行 后 ， 会 阻塞 
在 对 客户 的 FIFO 的 open 调 用 中 ， 因 为 客户 “《“ 即 我 们 的 shell) 还 没有 打开 
该 FIFO 来 读 〈 回 想 图 4-21) 。 服 务 器 对 该 FIFO 的 open 调 用 一 直 阻 塞 到 我 
们 在 以 后 某 个 时 候 执 行 cat 命 令 为 止 ， 该 命令 打开 这 个 FIFO 来 读 ， 服 务 
器 的 open 调 用 随 之 返回 。 这 种 时 间 顺 序 关 系 还 会 导致 拒绝 服务 Cdenial- 
of-service) 型 攻击 ， 我 们 将 在 下 一 节 讨 论 。 

使 用 shell 还 允许 简单 测试 服务 器 的 出 错 处 理 。 我 们 可 以 简单 地 向 服 
务 器 发 送 一 行 不 带 进程 ID 的 请 求 ， 也 可 以 向 它 发 送 一 行 所 带 进程 ID 
在 /tmp 目 录 中 没有 对 应 的 FIFO 的 请 求 。 举 例 来 说 ， 如 果 在 启动 服务 器 后 
输入 如 下 行 : 


solaris % cat > /tmp/fifo.serv 








/no/process/id 

999999 /invalid/process/id 

那么 服务 器 的 输出 《在 另 一 个 窗口 中 ) 如 下 : 

solaris % server 

bogus request: /no/process/id 

cannot open: /tmp/fifo.999999 

4.8.1 FIFO write 的 原子 性 

本 而 介 绍 的 简单 客户 -服务 器 程序 还 能 让 我 们 体会 到 管道 和 FIFO 的 
write 操作 的 原子 性 相当 重要 。 假 设 有 两 个 客户 差不多 同时 问 服 务 器 发 送 
请 求 。 第 一 个 客户 的 请 求 行 如 下 : 

1234 /etc/inet/ntp.conf 

第 二 个 客户 的 请 求 行 如 下 : 


9876 /etc/passwd 

假设 每 个 客户 给 目 己 的 请 求 行 执行 单个 write 图 数 调用 ， 而 且 每 个 请 
求 行 都 小 于 或 等 于 PIPE_BUF《〈 这 样 假设 是 合理 的 ， 因 为 PIPE_BUF 通 党 
在 1024 和 5120 之 间 ， 而 路 径 名 往往 限制 成 最 多 1024 字 节 ) ， 那 么 系统 保 
证 该 FIFO 中 的 数据 或 者 是 

1234 /etc/inet/ntp.conf 

9876 /etc/passwd 

或 者 是 

9876 /etc/passwd 

1234 /etc/inet/ntp.conf 

该 FIFO 中 的 数据 不 会 像 是 下 面 的 模样 : 

1234 /etc/inet9876 /etc/passwd 








/ntp.conf 

4.8.2 FIFO 与 NFS 的 关系 

FIFO 是 一 种 只 能 在 单 台 主机 上 使 用 的 IPC 形 式 。 尽 管 在 文件 系统 中 
有 名 字 ， 它 们 也 只 能 用 在 本 地 文件 系统 上 ， 而 不 能 用 在 通过 NFS 安 闭 的 
文件 系统 上 。 

solaris % mkfifo /nfs/bsdi/usr/rstevens/fifo.temp 

mkfifo: I/O error 

上 面 的 例子 中 ， 文 件 系统 mnfs/bsdiusr 是 主机 bsdi 上 的 /usr 文 件 系统 。 

有 些 系 统 〈 例 如 BSD/OS) 确实 允许 在 通过 NFS 安 装 的 文件 系统 上 
创建 FFO， 但 是 数据 无 法 在 这 样 的 两 个 系统 间 通 过 这 些 FIFO 传 递 。 这 
种 情形 下 ，FIFO 只 是 用 作 同 一 主机 上 客户 和 服务 器 之 间 位 于 文件 系统 中 
的 集结 点 。 即 使 在 不 同 主机 上 的 茶 两 个 进程 都 能 通过 NFS 打 开 同 一 个 
FIFO， 它 们 也 不 能 通过 该 FIFO 从 一 个 进程 同 男 一 个 进程 发 送 数 据 。 
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上 一 节 的 简单 客户 -服务 器 程序 例子 中 ， 服 务 器 是 一 个 迭代 服务 器 
(iterative server) 。 它 逐一 处 理 客户 请 求 ， 而 且 是 在 完全 处 理 每 个 客户 
的 请 求 后 再 接待 下 一 个 客户 。 举 例 来 说 ， 如 果 有 两 个 客户 几乎 同时 问 服 
务 器 发 送 一 个 请 求 一 一 第 一 个 客户 请 求 一 个 10M 字 节 的 文件 ， 服 务 器 把 
它 发 送 给 该 客户 需 花 《譬如 说 ) 10 秒 ， 第 二 个 客户 请 求 一 个 10 字 节 的 文 
件 一 一 那么 第 二 个 客户 必须 等 竺 至 少 10 秒 ， 以 让 第 一 个 客户 的 请 求 被 处 
B6. 

另 一 种 设计 是 并 发 服务 器 (concurrent server) 。Unix 下 最 常见 的 并 
发 服务 器 类 型 称 为 每 个 客户 一 个 子 进 程 〈one-child-per-client) 服务器 ， 
每 当 有 一 个 客户 请 求 到 达 时 ， 这 种 服务 器 就 让 主 进程 调用 fork 派 生出 一 
个 新 的 子 进程 。 该 新 子 进程 处 理 相 应 的 客户 请 求 ， 直 到 完成 为 止 ， 而 
Unix 的 多 程序 运行 特性 提供 了 所 有 不 同 进 程 间 的 并 发 性 。UNPVl 第 27 章 
还 详细 讨论 了 其 他 并 发 服务 器 设计 技巧 。 

创建 一 个 子 进程 池 ， 让 池 中 某 个 空子 进程 为 一 个 新 的 客户 服务 。 

为 每 个 客户 创建 一 个 线程 。 

创建 一 个 线程 池 ， 让 凶 中 某 个 空闲 线程 为 一 个 新 的 客户 服务 。 

尽管 UNPvl 中 的 讨论 是 针对 网 络 服务 器 的 ， 同 样 的 技巧 也 适用 于 
IPC 服 务 器 ， 差 别 只 是 IPC 服 务 器 的 客户 总 是 跟 服务 器 运行 在 同一 主机 
:| 

拒绝 服务 型 攻击 

我 们 已 提 及 迭代 服务 器 的 一 个 问题 一 一 某 些 客户 必须 等 待 比 预期 要 
长 的 时 间 ， 因 为 它们 被 排 在 请 求 处 理 时 间 较 长 的 其 他 客户 之 后 一 一 然而 
还 存在 另 一 个 问题 。 回 想 上 一 节 中 从 shell 完 成 与 服务 器 交互 的 例子 ， 我 
们 讨论 了 当 客 户 还 没有 打开 自己 的 FIFO 时 (客户 的 打开 操作 要 到 我 们 执 
行 cat 命 令 时 才 发 生 ) ， 服 务 器 是 怎样 阻塞 在 对 该 FIFO 的 open 调 用 上 
的 。 这 意味 着 某 个 恶意 的 客户 可 以 让 服务 器 处 于 停顿 状态 ， 办 法 是 给 它 
发 送 一 个 请 求 行 ， 但 从 来 不 打开 自己 的 FIFO 来 读 。 这 称 为 拒绝 服务 

















(DoS) 型 攻击 。 为 避免 这 种 攻击 ， 在 编写 任何 服务 器 程序 的 迭代 部 分 
时 必须 小 心 ， 要 留意 服务 器 可 能 在 哪儿 阻塞 以 及 可 能 阻塞 多 久 。 处 理 这 
种 问题 的 方法 之 一 是 在 特定 操作 上 设置 一 个 超时 时 钟 ， 但 是 把 服务 器 程 
序 编 写成 并 发 服务 器 而 不 是 迭代 服务 器 通常 更 为 简单 ， 这 么 一 来 ， 上 述 
类 型 的 拒绝 服务 型 攻击 只 影响 一 个 子 进程 ， 而 不 会 影响 主 服务 莫 。 即 使 
采用 并 发 服务 器 ， 拒 绝 服 务 型 攻击 仍 可 能 发 生 : 一 个 恶意 的 客户 可 能 友 
送 大 量 的 独立 请 求 ， 导 致 服务 器 达到 它 的 子 进程 数 限制 ， 从 而 使 得 后 续 
的 fork 失 败 。 














到 此 为 止 所 给 出 的 使 用 管道 和 FIFO 的 例子 都 使 用 字 节 流 ILO 模 型 ， 
这 是 Unix 的 原生 IO 模型 。 这 种 模型 不 存在 记录 边界 ， 也 就 是 说 读 写 操 
作 根 本 不 检查 数据 。 举 例 来 说 ， 从 某 个 FIFO 中 读 出 100 个 字 市 的 进程 无 
法 判定 往 该 FIFO 中 写 入 这 100 个 字 节 的 进程 执行 了 单个 100 字 节 的 写 操 
作 、5 个 20 字 节 的 号 操作 、2 个 50 字 节 的 号 操作 还 是 另外 某 种 总 共 为 100 
字 节 的 写 操作 的 组 合 。 一 个 进程 往 该 FIFO 中 写 入 55 个 字 节 后 ， 另 一 个 进 
程 再 写 入 45 字 节 ， 这 样 的 情况 同样 是 可 能 的 。 这 样 的 数据 是 一 个 字 节 流 
(byte stream) ， 系 统 不 对 它 作 解释 。 如 果 需 要 某 种 解释 ， 写 进程 和 读 
进程 就 得 先 验 [3] 地 同意 这 种 解释 ， 并 亲自 去 做 。 

有 时 候 应 用 希望 对 所 传送 的 数据 加 上 某 种 结构 。 当 数据 由 长 度 可 变 
消息 构成 ， 并 且 读 出 者 必须 知道 这 些 消息 的 边界 以 判定 何 时 已 读 出 单个 
消息 时 ， 这 种 需求 可 能 发 生 。 下 面 三 种 技巧 经 常用 于 这 个 目的 。 

() 带 内 特殊 终止 序列 : 许多 Unix 应 用 程序 使 用 换行 符 来 分 隔 每 个 消 
息 。 写 进程 会 给 每 个 消息 添加 一 个 换行 符 ， 读 进程 则 每 次 读 出 一 行 。 图 
4-23 和 图 4-24 中 的 客户 程序 和 服务 器 程序 就 用 这 种 方法 分 隔 各 个 客户 请 
求 。 这 种 技巧 一 般 要 求 数据 中 任何 出 现 分 隔 符 处 都 作 转 义 处 理 〈 也 就 是 








说 以 某 种 方式 把 它们 标志 成 数据 ， 而 不 是 作为 分 隔 符 ) 。 

许多 因特网 应 用 程序 (FTP、SMTP、HTTP、NNTP) 使 用 由 一 个 
回 车 符 后 跟 一 个 换行 符 构 成 的 双 字 符 序 列 〈CR/LEF) 来 分 隔 文 本 记录 。 

(2) 显 式 长 度 : 每 个 记录 前 冠 以 它 的 长 度 。 我 们 将 马上 使 用 这 种 技 
巧 。 当 用 在 TCP 上 时 ，Sun RPC 也 使 用 这 种 技巧 。 这 种 技巧 的 优势 之 一 
是 不 再 需要 通过 转 义 出 现在 数据 中 的 分 隔 符 ， 因 为 接收 者 不 必 扫 描 整 个 
数据 以 寻找 每 个 记录 的 结束 位 置 。 

(3) 每 次 连接 一 个 记录 : 应 用 通过 关闭 与 其 对 端的 连接 (网 络 应 用 时 
为 TCP 连 接 ，IPC 应 用 时 为 IPC 连 接 ) 来 指示 一 个 记录 的 结束 。 这 要 求 为 
每 个 记录 创建 一 个 新 连接 ，HTTP 1.0 就 使 用 了 这 一 技术 。 

标准 IO 函数 库 也 能 用 于 读 或 写 一 个 管道 或 FIFO 。 既 然 打 开 一 个 管 
道 的 唯一 方法 是 使 用 pipe 函 数 〈 它 返回 的 是 文件 描述 符 ) ， 为 创建 一 个 
新 的 标准 IO 流 〈stream) ， 必 须 使 用 标准 WO 疯 数 fdopen 以 将 该 标准 1/O 
流 与 由 pipe 返 回 的 某 个 已 打开 描述 符 相 关联 。 

也 可 以 构建 更 为 结构 化 的 消息 ， 这 种 能 力 是 由 Posix 消 息 队 列 和 
System V 消 息 队 列 提供 的 。 我 们 将 看 到 每 个 消息 有 一 个 长 度 和 一 个 优先 
级 (System V 称 后 者 为 “类 型 >) 。 长 度 和 优先 级 是 由 发 送 者 指定 的 ， 消 
息 被 读 出 后 ， 这 两 者 都 返回 给 读 出 者 。 每 个 消息 是 一 个 记录 

(record) ， 类 似 于 UDP 数 据 报 CUNPvl) 。 

我 们 也 能 给 一 个 管道 或 FIFO 增 加 些 结构 。 在 图 4-25 所 示 的 mesg.h 头 

文件 中 ， 我 们 定义 了 一 个 消息 。 

















pipemesg/mesg.h 





1 #include "unpipc.h" 


N 


/* Our own "messages" to use with pipes, FIFOs, and message queues. */ 


3 /* want sizeof (struct mymesg) <= PIPE BUF */ 
4 #define MAXMESGDATA (PIPE BUF - 2*sizeof (long) ) 


5 /* length of mesg len and mesg type */ 
6 #define MESGHDRSIZE (sizeof(struct mymesg) - MAXMESGDATA) 


7 struct mymesg { 


8 long mesg len; /* #bytes in mesg data, can be 0 */ 
9 long mesg type; /* message type, must be > 0 */ 

10 char mesg data [MAXMESGDATA] ; 

Jl fe 


12 ssize t mesg send(int, struct mymesg *); 
13 void Mesg send(int, struct mymesg *); 
14 ssize t mesg recv(int, struct mymesg *); 
15 ssize t Mesg recv(int, struct mymesg *); 
pipemesg/mesg.h 





图 4-25 我 们 的 mymesg 结 构 及 相关 定义 

每 个 消 恩 有 一 个 mesg_type， 我 们 把 它 定义 成 一 个 值 必须 大 于 0 的 整 
数 。 我 们 现在 暂时 忽略 这 个 类 型 成 员 ， 到 第 6 章 中 讲述 System VIA 
列 时 再 讨论 它 。 每 个 消息 还 有 一 个 长 度 ， 我 们 允许 它 为 0。 我 们 使 用 
mymesg 结 构 在 每 个 消息 前 冠 以 它 的 长 度 ， 而 没有 使 用 换行 符 来 分 隅 消 
轧 。 早 些 时 候 我 们 提 到 过 这 种 设计 方法 的 两 个 好 处 : 接收 者 不 必 扫 描 所 
收 到 的 每 个 字 节 以 找 出 消息 的 结束 位 置 ， 即 使 分 隅 符 〈 换 行 符 ) 出 现在 
消息 中 也 不 必 将 它 转 义 。 

图 4-26 展 示 了 mymesg 结 构 的 图 示 以 及 我 们 如 何 随 管道 、FIFO 和 
System VÄ ELA FEE o 

我 们 定义 两 个 函数 分 别 发 送 和 接收 消息 。 图 4-27 给 出 了 我 们 的 
mesg_send 函 数 ， 图 4-28 给 出 了 我 们 的 mesg_recv 函 数 。 











用 作 write 和 read 的 第 二 个 参数 
用 作 msgsnd 和 msgrcv 的 第 二 个 参数 


~- 一 一 mesg len — —- 


mesg data 






mesg len mesg type 





SS ee 
System V 消 息 : msgbuf{}， 随 System V 
消息 队列 使 用 ，msgsnda 和 msgrcv 国 数 





我 们 的 消息 : my mesg{}， 随 管道 和 消息 
队列 使 用 ，write 和 readq 函 数 


图 4-26 我 们 的 mymesg 结 构 
pipemesg/mesg_send.c 
1 #include "mesg.h" 


2 ssize t 

3 mesg send(int fd, struct mymesg *mptr) 
4 { 
5 
6 


} 


return (write (fd, mptr, MESGHDRSIZE + mptr-»mesg len)); 





pipemesg/mesg_send.c 


图 4-27 mesg_send PK Zi 





pipemesg/mesg recv.c 
1 #include "mesg.h" 


2 ssize t 
3 mesg recv(int fd, struct mymesg *mptr) 


4 ( 

5 size t len; 

6 ssize t n; 

7 /* read message header first, to get len of data that follows */ 
8 if ( (n = Read(fd, mptr, MESGHDRSIZE)) == 0) 

9 return(0); /* end of file */ 

10 else if (n != MESGHDRSIZE) 

11 err quit("message header: expected $d, got $d", MESGHDRSIZE, n); 
12 if ( (len = mptr-»mesg len) > 0) 

13 if ( (n = Read(fd, mptr->mesg data, len)) !- len) 

14 err quit("message data: expected $d, got $d", len, n); 

15 return (len); 

16 } 





pipemesg/mesg recv.c 


图 4-28 mesg_recv 函 数 

现在 读 出 每 个 消息 需 调 用 两 个 read， 一 个 读 出 消息 长 度 ， 另 一 个 读 
出 真正 的 消息 〈 如 果 长 度 大 于 0 的 话 ) 。 

细心 的 读者 可 能 注意 到 mesg_recv 会 检查 所 有 可 能 的 错误 是 否 发 
生 ， 一 旦 发 现 则 马上 终止 。 然 而 为 一 致 性 起 见 ， 我 们 还 是 定义 了 一 个 名 
为 Mesg_recv 的 包 于 函数 ， 并 在 我 们 的 程序 中 调用 它 。 

现在 把 我 们 的 客户 函数 和 服务 器 函数 改 为 使 用 mesg_send 和 
mesg recv 图 数 。 图 4-29 给 出 了 新 的 客户 函数 。 





1 #include "mesg.h" 


2 void 
3 client (int readfd, int writefd) 


pipemesg/client.c 





5 size t len; 
6 ssize t n; 
7 struct mymesg  mesg; 
8 /* read pathname */ 
9 Fgets(mesg.mesg data, MAXMESGDATA, stdin); 
10 len - strlen(mesg.mesg data); 
TT if (mesg.mesg data[len-1] == '\n') 
12 len--; /* delete newline from fgets() */ 
T3 mesg.mesg len - len; 
14 mesg.mesg type - 1; 
15 /* write pathname to IPC channel */ 
16 Mesg send(writefd, &mesg); 
17 /* read from IPC, write to standard output */ 
18 while ( (n = Mesg recv(readfd, &mesg)) > 0) 
19 Write(STDOUT FILENO, mesg.mesg data, n); 
20 } 
pipemesg/client.c 
图 4-29 我 们 的 使 用 消息 的 client 函 数 





读 出 路 径 名 ， 发 送 给 服务 需 
8 一 16 从 标准 输入 该 出 路 径 名 ， 





然后 使 用 mesg_send 将 其 发 送 给 服务 


读 出 来 自 服务 器 的 文件 内 容 或 出 错 消 忆 

17~19 客户 在 一 个 循环 中 调用 mesg_recv， 读 出 服务 器 发 送 回 的 所 
有 东西 。 按 照 约 定 ，mesg_recv 返 回 一 个 值 为 0 的 长 度 表 示 已 到 达 来 自 服 
务 右 的 数据 的 结尾 。 我 们 将 看 到 服务 器 将 在 发 送 给 客户 的 每 个 消息 中 都 


ALS IS Y. 


包含 换行 符 ， 
图 4-30 给 出 了 新 的 服务 器 函数 。 


因此 空 行 也 会 有 一 个 值 为 1 的 消息 长 度 。 


从 IPC 通 道 读 出 路 径 名 ， 打 开 文 件 


8—18 读 出 来 目 客 户 的 路 径 名 。 


尽管 这 儿 给 mesg_type 赋 值 为 1 看 来 


KH Cer A4-28'F mesg recv? 5) ， 在 使 用 System V3 BA FJ] 
(Al6-10) ， 我 们 仍然 会 调用 本 函数 ， 那 时 是 需要 这 样 的 赋值 的 〈 例 如 
图 6-13) 。 标 准 VO 函 数 fopen 打 开 该 路 径 名 的 文件 ， 这 与 图 4-10 中 调用 


Unix IO 本 数 open 获 得 访问 该 文件 的 一 个 摘 述 符 不 一 样 。 这 儿 我 们 调用 
标准 WO 函数 库 的 原因 是 为 了 调用 fgets 逐 行 地 读 出 该 文件 ， 然 后 把 每 一 
行 作 为 一 个 消息 发 送 给 客户 。 

将 文件 复制 给 客户 

19~26 ”如 果 fopen 调 用 成 功 ， 束 使 用 fgets 读 出 该 文件 并 发 送 给 客 
户 ， 每 个 消息 一 行 。 一 个 长 度 为 0 的 消息 表示 已 到 达 文 件 尾 。 

在 使 用 管道 或 FIFO 时 ， 也 可 以 通过 关闭 IPC 通 道 来 通知 对 端 已 到 达 
输入 文件 的 结尾 。 不 过 我 们 通过 发 送 回 一 个 长 度 为 0 的 消息 来 达到 同样 
目的 ， 因 为 之 后 还 会 遇 到 没有 文件 结束 符 概 念 的 其 他 类 型 的 IPC。 








1 #include "mesg.h" 


2 void 
3 server(int readfd, int writefd) 


& 1 


5 FILE *fp; 

6 ssize t n; 

d struct mymesg mesg; 

8 /* read pathname from IPC channel */ 

9 mesg.mesg type = 1; 

10 if ( (n = Mesg recv(readfd, &mesg)) == 0) 

LI err quit("pathname missing"); 

12 mesg.mesg data[n] = '\0'; /* null terminate pathname */ 
L3 if ( (fp = fopen(mesg.mesg data, "r")) -- NULL) { 

14 /* error: must tell client */ 

15 snprintf (mesg.mesg data + n, sizeof(mesg.mesg data) - n, 
16 ": can't open, %s\n", strerror(errno)); 

17 mesg.mesg len - strlen(mesg.mesg data); 

18 Mesg send(writefd, &mesg) ; 

19 ) eise ( 

20 /* fopen succeeded: copy file to IPC channel */ 

21 while (Fgets(mesg.mesg data, MAXMESGDATA, fp) !- NULL) { 
22 mesg.mesg len - strlen(mesg.mesg data); 

23 Mesg send(writefd, &mesg); 

24 ) 

25 Fclose(fp); 

26 ) 

27 /* send a 0-length message to signify the end */ 

28 mesg.mesg len - 0; 

29 Mesg send(writefd, &mesg); 

30 } 





图 4-30 我 们 的 使 用 消息 的 server 函 数 


pipemesg/server.c 


pipemesg/server.c 


调用 我 们 的 client 和 server 了 水 数 的 main 函 数 根本 不 变 。 我 们 既 可 使 用 


管道 版 本 (图 4-8) ， 也 可 使 用 FIFO 版 本 (图 4-16) 。 
4.11 管道 和 FIFO 限 制 
系统 加 于 管道 和 FIFO 的 唯一 限制 为 : 


OPEN MAX 一 个 进程 在 任意 时 刻 打开 的 最 大 描述 符 数 (Posix 要 求 


至 少 为 16) ; 


PIPE BUF 可 原子 地 写 往 一 个 管道 或 FIFO 的 最 大 数据 量 〈 我 们 在 4.7 


节 讲 述 过 ，Posix 要 求 至 少 为 512) 。 





我 们 马上 会 看 到 OPEN_MAX 的 值 可 通过 调用 sysconf 函 数 得 询 。 
通常 可 通过 执行 ulimit 命 令 〈Bourne — shell 或 KornShell， 我 们 马上 会 看 
到 ) 或 limit 命 令 〈C shell) 从 shell 中 修改 。 它 也 可 通过 调用 setrlimit 函 数 
(在 APUE 的 7.11 节 中 详细 讲述 ) 从 一 个 进程 中 修改 。 

PIPE_BUF 的 值 通常 定义 在 <limits.h> 头 文件 中 ， 但 是 Posix 认 为 它 是 
一 个 路 径 名 变量 (pathname variable) 。 这 意味 着 它 的 值 可 以 随 所 指定 
的 路 径 名 而 变化 (只 对 FIFO 而 言 ， 因 为 管道 没有 名 字 ) ， 因 为 不 同 的 路 
径 名 可 以 沙 在 不 同 的 文件 系统 上 ， 而 这 些 文件 系统 可 能 有 不 同 的 特征 。 
于 是 PIPE_BUF 的 值 可 在 运行 时 通过 调用 pathconf 或 fpathconf 取 得 。 图 4- 
31 给 出 了 输出 这 两 个 限制 值 的 一 个 例子 程序 。 





pipe/pipeconf.c 





1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 
ay 
if (arge |= 2) 
err quit ("usage: pipeconf <pathname>") ; 


5 
6 
7 printf ("PIPE BUF = $1d, OPEN MAX = %ld\n", 
8 Pathconf (argv[1], PC PIPE BUF), Sysconf( SC OPEN MAX) ) ; 
9 exit (0); 

0 


1 


} 
pipe/pipeconf.c 





图 4-31 在 运行 时 确定 PIPE_BUF 和 OPEN_MAX 的 值 


下 面 是 一 些 例子 ， 指 定 了 不 同 的 文件 系统 。 

solaris % pipeconf / Solaris 2.6 默 认 值 

PIPE BUF = 5120,0PEN MAX = 64 

solaris % pipeconf /home 

PIPE BUF = 5120,0PEN MAX = 64 

solaris 96 pipeconf /tmp 

PIPE BUF = 5120,0PEN MAX = 64 

alpha 96 pipeconf / Digital Unix 4.0B 默 认 值 
PIPE BUF = 4096,0PEN MAX = 4096 





alpha % pipeconf /usr 
PIPE BUF = 4096,0PEN MAX = 4096 
下 面 给 出 在 Solaris 下 如 何 使 用 KornShell 修 改 OPEN_MAX 的 值 。 


solaris % ulimit -nS 输出 最 大 描述 符 数 ， 软 限 
制 64 

solaris % ulimit -nH 输出 最 大 描述 符 数 ， 硬 限 
制 

1024 

solaris % ulimit —ns 512 设置 软 限制 为 512 

solaris % pipeconf / 验证 该 变动 已 发 生 


PIPE BUF = 5120,0PEN MAX = 512 
尽管 能 够 修改 FIFO 的 PIPE_BUF 的 值 ， 这 取决 于 路 径 名 所 存放 的 底 
层 文件 系统 ， 但 实际 应 该 很 少 这 么 做 。 

APUE 的 第 2 章 描述 了 fpathconf、pathconf 和 sysconf 函 数 ， 这 些 函 数 
提供 了 有 关 特 定 内 核 限 制 的 运行 时 信息 。Posix.1 定 义 了 以 _PC_ 开头 的 12 
个 常 值 和 以 _SC_ 开 头 的 52 个 常 值 。Digital Unix 4.0B 和 Solaris 2.6 都 对 后 
者 作 了 扩充 ， 定 义 了 约 100 个 可 使 用 sysconf 碍 询 的 运行 时 第 值 。 

Posix.2 定 义 了 getconf 命 令 ， 它 可 以 输出 这 些 实现 限制 值 中 的 大 多 
数 。 例 如 : 

alpha % getconf OPEN_MAX 

4096 

alpha % getconf PIPE_BUF / 

4096 


4.12 小 结 
管道 和 FIFO 是 许多 应 用 程序 的 基本 构建 模块 。 管 道 普遍 用 于 shell 





中 ， 不 过 也 可 以 从 程序 中 使 用 ， 往 往 是 用 于 从 子 进 程 回 父 进程 回 传 信 
妃 。 使 用 管道 时 涉及 的 某 些 代码 Cpipe. fork. close. exec#llwaitpid) 
可 通过 使 用 popen 和 pclose 来 避免 ， 由 它们 处 理 具体 细节 并 激活 一 个 
shell. 

FIFO 与 管道 类 似 ， 但 它们 是 用 mkfifo 创 建 的 ， 之 后 需 用 open 打 开 。 
打开 管道 时 必须 小 心 ， 因 为 有 许多 规则 (图 4-21) 制约 着 open 的 阻塞 与 


不 
Hs 





在 使 用 管道 和 FIFO 的 前 提 下 ， 我 们 查看 了 一 些 客户 -服务 器 程序 设 
th: 一 个 服务 器 服务 多 个 客户 ， 服 务 器 可 以 是 迭代 的 ， 也 可 以 是 并 发 
的 。 和 迭代 服务 器 以 串 行 方式 每 次 处 理 一 个 客户 请 求 ， 它 们 易 遭 受 拒 绝 服 
务 型 攻击 。 并 发 服务 器 则 让 另外 一 个 进程 或 线程 处 理 每 个 客户 请 求 。 

管道 和 FIFO 的 特征 之 一 是 它们 的 数据 是 一 个 字 市 流 ， 类 似 于 TCP 连 
接 。 把 这 种 字 节 流 分 隔 成 各 个 记录 的 任何 方法 都 得 由 应 用 程序 来 实现 。 
我 们 将 在 接 下 去 的 两 章 中 看 到 消息 队列 会 提供 记录 边界 ， 类 似 于 UDP 数 
据 报 。 





习题 


44 在 从 图 4-3 到 图 4-4 的 转换 中 ， 如 果子 进程 没有 执行 close(fd[1])， 
那么 会 发 生 什么 情况 ? 

4.2 在 4.6 节 描述 mkfifo 时 ， 我 们 说 过 要 打开 一 个 已 有 的 FIFO 或 创建 
一 个 新 的 FIFO， 应 该 调用 mkfifo， 检 查 是 否 返 回 EEXIST 错 误 ， 若 是 则 
调用 open。 如 果 把 这 个 逻辑 关系 变换 一 下 ， 先 调用 open， 当 不 存在 所 期 
望 的 FIFO 时 再 调用 mkfifo， 那 么 会 发 生 什么 情况 ? 

4.3 在 图 4-15 中 调用 popen 时 ， 如 果 其 中 执行 命令 的 shell 碰 到 错误 ， 
那么 会 发 生 什么 情况 ? 

AA 把 图 4-23 中 针对 服务 器 的 FIFO 的 open 去 掉 ， 验 证 一 下 这 将 导致 





当 不 再 有 客户 存在 时 ， 服 务 器 即 终止 。 

4.5 ”在 图 4-23 中 我 们 指出 ， 当 服务 器 启动 后 ， 它 阻 罕 在 自己 的 第 一 
个 open 调 用 中 ， 直 到 客户 的 第 一 个 open 打 开 同 一 个 FIFO 用 于 写 为 止 。 我 
们 怎样 才能 绕 过 这 样 的 阻塞 ， 使 得 两 个 open 都 立即 返回 ， 转 而 阻 暑 在 站 
次 调用 readline 上 ? 

4.6 ”如 果 图 4-24 中 的 客户 程序 对 换 其 两 个 open 调 用 的 顺序 ， 那 么 会 
发 生 什么 情况 ? 

4.7 为 什么 在 读 进 程 关 闭 管 道 或 FIFO 之 后 给 写 进 程 产生 一 个 信号 ， 
而 不 会 在 写 进 程 关 闭 管道 或 FIFO 之 后 给 读 进程 产生 一 个 信号 ? 

4.8 ”编写 一 个 小 测试 程序 ， 确 定 fstat 是 否 以 stat 结 构 的 st_size 成 员 的 
形式 返回 当前 在 某 个 FIFO 中 的 数据 字 节 数 。 

49 写 一 个 小 测试 程序 ， 以 确定 在 为 一 个 读 出 端 已 关闭 的 管道 描述 
符 选 择 可 写 条 件 时 select 返 回 的 内 容 。 





第 5 章 Posi MAJI 


5.1 概述 


消息 队列 可 认为 是 一 个 消息 链表 。 有 足够 写 权 限 的 线程 可 往 队 列 中 
放置 消 妃 ， 有 足够 读 权限 的 线程 可 从 队列 中 取 走 消息 。 每 个 消息 都 是 一 
个 记录 (回想 我 们 在 4.10 市 就 字 节 流 和 消息 的 讨论 ) ， 它 由 发 送 者 赋予 
一 个 优先 级 。 在 某 个 进程 往 一 个 队列 写 入 消息 之 前 ， 并 不 需要 另外 某 个 
进程 在 该 队列 上 等 待 消息 的 到 达 。 这 跟 管 道 和 FIFO 是 相反 的 ， 对 后 两 者 
来 说 ， 除 非 读 出 者 已 存在 ， 人 否则 先 有 写 入 者 是 没有 意义 的 。 

一 个 进程 可 以 往 某 个 队列 写 入 一 些 消 息 ， 然 后 终止 ， 再 让 另外 一 个 
进程 在 以 后 某 个 时 刻 读 出 这 些 消息 。 我 们 说 过 消息 队列 具有 随 内 核 的 持 
续 性 〈1.3 节 ) ， 这 跟 管 道 和 FIFO 不 一 样 。 我 们 在 第 4 章 中 说 过 ， 当 一 个 
管道 或 FIFO 的 最 后 一 次 关闭 发 后 时 ， 仍 在 该 管道 或 FIFO 上 的 数据 将 被 
EF. 

本 章 讲述 Posix 消 息 队 列 ， 第 6 章 讲述 System V 消 息 队 列 。 这 两 组 函 
数 间 存在 许多 相似 性 ， 下 面 是 主要 的 差别 。 

对 Posix 消 恩 队 列 的 恋 总 是 返回 最 高 优先 级 的 最 早 消 息 ， 对 System V 
消息 队列 的 读 则 可 以 返回 任意 指定 优先 级 的 消 乱 。 

当 往 一 个 空 队 列 放置 一 个 消息 时 ，Posix 消 息 队 列 允 许 产 生 一 个 信 
号 或 启动 一 个 线程 ， System V 消 息 队 列 则 不 提供 类 似 机 制 。 

队列 中 的 每 个 消息 具有 如 下 属性 : 

一 个 无 符号 整数 优先 级 〈Posix) 或 一 个 长 整数 类 型 (System V) ; 

消息 的 数据 部 分 长 度 〈 可 以 为 0) ; 

数据 本 喘 《〈 如 果 长 度 大 于 0) 。 
































注意 这 些 特 征 不 同 于 管道 和 FIFO。 后 两 者 是 字 节 流 模型 ， 没 有 消息 
边界 ， 也 没有 与 每 个 消息 关联 的 类 型 。 我 们 在 4.10 节 就 此 讨论 过 ， 并 给 
管道 和 FIFO 增 设 了 自己 的 消 妃 接口 。 

图 5-1 展 示 了 一 个 消息 队列 的 可 能 布局 。 


F 一 个 消息 
优先 级 =20 



































下 一 个 消息 
优先 级 =30 







NULL 


优先 级 =10 


mq msgsize 









图 5-1 含有 三 个 消息 的 某 个 Posix 消 息 队 列 的 可 能 

我 们 所 设想 的 是 一 个 链表 ， 访 链表 的 头 中 含有 当前 队列 的 两 个 属 
PE: 队列 中 人 允许 的 最 大 消息 数 以 及 每 个 消息 的 最 大 大 小 。 我 将 在 5.3 节 
中 详细 讨论 这 两 个 属性 。 

从 本 章 开 始 我 们 使 用 一 种 新 的 程序 设计 技巧 ， 它 在 以 后 讨论 消息 队 
列 、 信 号 量 和 共享 内 存 区 的 各 章 中 也 会 用 到 。 既 然 所 有 这 些 IPC 对 象 至 
少 上 共有 随 内 核 的 持续 性 〈 回 想 1.3 节 ) ， 于 是 我 们 可 以 编写 生生 小 程序 
来 使 用 这 些 IPC 机 制 ， 以 便 深 入 地 认识 它们 ， 并 深刻 地 了 解 它们 的 操 
作 。 例 如 ， 我 们 可 编写 一 个 程序 来 创建 一 个 Posix 消 息 队 列 ， 编 写 男 一 
个 程序 来 往 某 个 Posix 消 息 队 列 中 加 入 一 个 消息 ， 再 编写 男 一 个 程序 来 
从 某 个 Posix 消 息 队 列 中 读 出 一 个 消息 。 通 过 以 不 同 的 优先 级 构造 各 个 
消息 ， 我 们 可 以 看 出 mq_receive 函 数 是 怎样 返回 这 些 消 息 的 。 


5.2 mq open. mq closefilmq unlinkr& Zi 
mq_open 函 数 创建 一 个 新 的 消息 队列 或 打开 一 个 已 存在 的 消息 队 


all 














列 。 
#include <mqueue.h> 
mqd_t mq open(const char *name, int oflag,... 
/* mode t mode,struct mq attr *attr */ ); 
返回 : ARIAK AA PUTATE, A h tA- 
我 们 已 在 2.2 节 摘 述 过 有 关 name 参 数 的 规则 。 
oflag 参 数 是 O_ RDONLY. O WRONLYZ&O RDWR 之 一 ， 可 能 按 
位 或 上 O_CREAT、O_EXCL 或 O NONBLOCK。 我 们 已 在 2.3 节 讲述 过 
所 有 这 些 标志 。 
当 实 际 操作 是 创建 一 个 新 队列 时 (已 指定 O_CREAT 标 志 ， 且 所 请 
求 的 消息 队列 尚未 存在 ) ， mode 和 attr 参 数 是 需要 的 。 我 们 在 图 2-4 中 给 
出 了 mode 值 。attr 参 数 用 于 给 新 队列 指定 茶 些 属性 。 如 果 它 为 空 指 针 ， 
那 就 使 用 默认 属性 。 我 们 将 在 5.3 节 讨论 这 些 属 性 。 
mq_open 的 返回 值 称 为 消息 队列 描述 人 符 (mesage queue 
descriptor) ， 但 它 不 必 是 (而 且 很 可 能 不 是 ) 像 文件 描述 符 或 套 接 字 描 
述 符 这 样 的 短 整 数 。 这 个 值 用 作 其 余 7 个 消息 队列 函数 的 第 一 个 参数 。 
Solaris 2.6 把 mqd_t 定 义 为 void*， 而 Digital Unix 4.0B 把 它 定义 为 
int。 在 5.8 节 我 们 的 Posix 消 息 队 列 实 现 例 子 中 ， 消 息 队 列 描述 符 是 一 个 
结构 指针 。 称 这 些 数据 类 型 为 描述 符 是 一 个 不 泣 的 错误 。 
己 打开 的 消 妃 队列 是 由 mq_close 关 闭 的 。 


#include <mqueue.h> 





int mg_close(mqd_t mqdes); 
返回 : ARIU, Æ BEENA- 

其 功能 与 关闭 一 个 已 打开 文件 的 close 函 数 类 似 : 调用 进程 可 以 不 再 
使 用 该 描述 符 ， 但 其 消息 队列 并 不 从 系统 中 删除 。 一 个 进程 终止 时 ， 它 
的 所 有 打开 着 的 消 轧 队列 都 关闭 ， 束 像 调用 了 mdq_close 一 样 。 

要 从 系统 中 删除 用 作 mq_open 第 一 个 参数 的 某 个 name， 必 须 调 用 


mq_unlink. 

#include <mqueue.h> 

int mq_unlink(const char *name); 

返回 : 知 成 功 则 为 0， 帮 出 错 则 为 -1 

每 个 消 妃 队列 有 一 个 保存 其 当前 打开 痢 描 述 符 数 的 引用 计数 需 E 
像 文件 一 样 ) [4] ， 因 而 本 函数 能 够 实现 类 似 于 unlink 函 数 删除 一 个 
件 的 机 制 : 当 一 个 消 妃 队列 的 引用 计数 仍 大 于 0 时 ， 其 name 就 月 E 
但 是 该 队列 的 析 构 《这 与 从 系统 中 删除 其 名 字 不 同 ) 要 到 最 后 一 个 
mq_close 发 生 时 才 进 行 [5] 。 

Posix 消 息 队 列 至 少 具备 随 内 核 的 持续 性 (回想 1.3 节 )〉 。 这 就 是 
说 ， 即 使 当前 没有 进程 打开 着 茶 个 消息 队列 ， 该 队列 及 其 上 的 各 个 消 乱 
也 将 一 直 存 在 ， 直 到 调用 mq_unlink 并 让 它 的 引用 计数 达到 0 以 删除 该 队 
列 为 止 。 

我 们 将 看 到 ， 如 果 消 息 队 列 是 使 用 内 存 映射 文 件 〈12.2 节 ) 实现 
的 ， 那 么 它们 具有 随 文件 系统 的 持续 性 ， 但 这 不 是 必需 的 ， 因 而 不 能 指 
望 。 

5.2.1 例子 : mqcreatel 程 序 

既然 Posix 消 轧 队 列 至 少 具 有 随 内 核 的 持续 性 ， 我 们 于 是 可 以 编写 
一 组 小 程序 来 操纵 这 些 队 列 ， 以 提供 认 知 它们 的 简易 办 法 。 图 5-2 中 的 
程序 创建 一 个 消 息 队列 ， 其 名 字 是 作为 命令 行 参数 指定 的 。 











pxmsg/mqcreatel.c 
1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 


5 int c, flags; 

6 mqd_t mqd; 

7 flags - O RDWR | O CREAT; 

8 while ( (c = Getopt(argc, argv, "e")) !- -1) ( 
9 switch (c) ( 

10 case 'e': 

11 flags |= O EXCL; 

12 break; 

13 } 

14 

15 if (optind != argc = 1) 

16 err quit ("usage: mqcreate [ -e ] <name>"); 
q7 mqd = Mq open(argv[optind], flags, FILE MODE, NULL); 
18 Mq close (mqd) ; 

19 exit (0); 


pxmsg/mqcreatel.c 











图 5-2 指定 排他 性 创建 标志 ， 创 建 一 个 消息 队列 


8 一 16 我 们 允许 有 一 个 指定 排他 性 创建 的 -e 选 项 。 (RF getopt žit 
和 它 的 Getopt 包 于 函数 ， 我 们 将 随 图 5-5 详 细 讨 论 。) 返回 时 ，getopt 在 
optind 中 存放 下 一 个 待 处 理 参 数 的 下 标 。 

17 直接 以 来 自命 令 行 的 IPC 名 字 调 用 mq_open， 而 不 去 调用 
px ipc namerPAZi (2.277) 。 这 样 我 们 就 能 准确 地 看 出 实现 是 如 何 处 理 
这 些 Posix IPC 名 字 的 。 (本 书 中 的 所 有 简单 测试 程序 都 这 么 处 理 。) 

下 面 是 在 Solaris 2.6 下 的 输出 。 


solaris % mqcreatel /temp.1234 第 一 次 创建 成 功 

-TW-TW-TW- 1  rstevens otherl 132632 Oct 23 17:08 
/tmp/.MQDtemp.1234 

-TW-TW-TW- 1  rstevens otherl 0 Oct 23 17:08 
/tmp/.MQLtemp.1234 

-TW-T--T-- 1  rstevens otherl 0 Oct 23 17:08 


/tmp/.MQPtemp.1234 


solaris % mqcreatel -e /temp.1234 指定 -e 选 项 的 第 二 次 创 
建 失败 

solaris % ls -l /tmp/.*1234 

mq open error for /temp.1234: File exists 

《我们 称 这 个 程序 为 mqcreatel， 因 为 它 将 在 我 们 说 明 属 性 后 ， 在 图 

5-5 中 得 以 改进 。) 第 三 个 文件 Gtemp/.MQPtemp.1234). 具有 我 们 用 
FILE_MODE 常 值 (用户 可 读 可 写 ， 组 成 员 和 其 他 用 户 只 读 ) 指定 的 权 
限 ， 另 外 两 个 文件 的 权限 则 不 一 样 。 我 们 猜测 文件 名 中 含有 D 的 文件 含 
有 数据 ， 含 有 工 的 文件 是 某 种 类 型 的 锁 ， 含 有 P 的 文件 指定 权限 。 

在 Digital Unix 4.0B 下 ， 我 们 可 看 到 所 创建 的 是 真正 的 路 径 名 。 

alpha 96 mqcreate1 /tmp/myq.1234 

alpha 96 Is -l /tmp/myq.1234 

-IW-r--r-- 1 rstevens system 11976 Oct 23 17:04 /tmp/myq.1234 

alpha % mqcreate1 -e /tmp/myq.1234 

mq open error for /tmp/myq.1234: File exists 

5.2.2 例子 : mqunlink 程 序 

图 5-3 中 的 mdqunlink 程 序 从 系统 中 删除 一 个 消息 队列 。 





pxmsg/mqunlink.c 
1 #include "unpipc.h" 
2 ant 
3 main(int argc, char **argv) 
& 1 
if (arge != 2) 
err quit("usage: mqunlink <name>") ; 


Mq _ unlink (argv [1]) ; 


exit (0); 


woo y Ov Ul 


pxmsg/mqunlink.c 





图 5-3 mq_unlink 一 个 消息 队列 


我 们 可 使 用 该 程序 删除 由 mqcreate 程 序 创建 的 消息 队列 。 
solaris % mqunlink /temp.1234 








我 们 早先 给 出 的 /mp 目录 下 的 所 有 三 个 文件 都 被 删除 了 。 
5.3 mq getattr 和 mgq setattr ph Z 


每 个 消息 队列 有 四 个 属性 ，mq_getattr 返 回 所 有 这 些 属性 ， 
mq_setattr 则 设置 其 中 某 个 属性 。 
#include <mqueue.h> 
int mq_getattr(mqd_t mqdes,struct mq attr *attr); 
int mq setattr(mqd t mqdes,const struct mq attr *attr,struct mq attr 
*oattr); 
BRI: 知 成 功 则 为 0， 寿 出 错 则 为 -1 
md_attr 结 构 含 有 以 下 属性 。 
struct mq_attr { 
long mq flags; /* message queue flag: 0,0 _NONBLOCK */ 
long mq_maxmsg; /* max number of messages allowed on queue */ 
long mq_msgsize; /* max size of a message (in bytes)*/ 
long mq_curmsgs; /* number of messages currently on queue */ 
js 
指向 菜 个 mq_attr 结 构 的 指针 可 作为 mq_open 的 第 四 个 参数 传递 ， 从 
而 允许 我 们 在 该 函数 的 实际 操作 是 创建 一 个 新 队列 时 ， 给 它 指 定 
mq_maxmsg 和 mq_msgsize 属 性 。mq_open 忽 略 该 结构 的 另外 两 个 成 员 。 
mq_getattr 把 所 指定 队列 的 当前 属性 填 入 由 attr 指 向 的 结构 。 
mq_setattr 给 所 指定 队列 设置 属性 ， 但 是 只 使 用 由 attr 指 问 的 mq_attr 
结构 的 mq_flags 成 员 ， 以 设置 或 清除 非 阻 塞 标志 。 该 结构 的 另外 三 个 成 
员 被 忽略 : 每 个 队列 的 最 大 消息 数 和 每 个 消息 的 最 大 字 节 数 只 能 在 创建 
队列 时 设置 ， 队 列 中 的 当前 消息 数 则 只 能 获取 而 不 能 设置 。 
另外 ， 如 果 oattr 指 针 非 空 ， 那 么 所 指定 队列 的 先前 属性 








(mq flags. mq_maxmsg#llmq_msgsize) 和 当前 状态 (mq curmsgs) 将 
返回 到 由 该 指针 指 问 的 结构 中 。 
5.3.1 例子 : mqgetattr 程 序 
图 5-4 中 的 程序 打开 一 个 指定 的 消 轧 队列 ， 并 输出 其 属性 。 


pxmsg/mqgetattr.c 





1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 mqd t mqd ; 

6 struct mq attr attr; 

"7 if large d 2) 

8 err quit ("usage: mqgetattr <name>") ; 

9 mqd = Mq open(argv[1], O RDONLY) ; 

10 Mq_getattr(mqd, &attr) ; 

JT printf("max #msgs = $1d, max #bytes/msg = $1d, " 
12 "#currently on queue = %ld\n", 

T3 attr.mq maxmsg, attr.mq msgsize, attr.mq curmsgs); 
14 Mq close (mqd) ; 

15 exit(0); 

16 } 


pxmsg/mqgetattr.c 








图 5-4 取得 并 输出 某 个 消息 队列 的 属性 
我 们 可 以 创建 一 个 消息 队列 并 输出 其 默认 属性 。 


solaris 96 mqcreate1 /hello.world 











solaris % mqgetattr /hello.world 

max #msgs = 128,max #bytes/msg = 1024,#currently on queue = 0 

现在 可 以 看 出 ， 在 图 5-2 之 后 以 默认 属性 创建 一 个 队列 的 例子 中 ， 
由 ]s 列 出 的 数据 文件 Ctmp/. MQDtemp.1234). 的 大 小 为 
128x1024+1560=132 632。1560 个 额外 字 市 也 许 是 开销 信息 : 每 个 消息 8 
字 节 ， 外 加 另外 536 个 字 节 。 

5.3.2 例子 : mqcreate 程 序 

我 们 可 以 对 图 5-2 中 的 程序 作 修改 ， 以 允许 指定 所 创建 队列 的 最 大 
消 恩 数 和 每 个 消息 的 最 大 大 小 。 我 们 不 能 只 指定 其 中 一 个 而 不 指定 另 一 








个 ， 即 两 者 都 得 指定 〈 不 过 见习 题 5.1) 。 图 5-5 是 修改 后 的 程序 。 





pxmsg/mqcreate.c 


1 #include "unpipc.h" 
2 struct mq attr attr; /* mq maxmsg and mq msgsize both init to 0 */ 
a nt 


4 main(int argc, char **argv) 


int c, flags; 
mqd t mqgd; 
flags - O RDWR | O CREAT; 
while ( (c = Getopt (argc, argv, "em:z:")) !- -1) ( 
switch (c) ( 
case 'e': 
flags |= O EXCL; 
break; 
case 'm': 
attr.mq maxmsg - atol(optarg); 
break; 
case '2': 
attr.mq msgsize - atol(optarg); 
break; 


) 
) 


if (optind !- argc - 1) 


err quit("usage: mqcreate [ -e ] [ -m maxmsg -z msgsize ] <name>"); 
if ((attr.mq maxmsg != 0 && attr.mq_msgsize == 0) || 
(attr.mq maxmsg == 0 && attr.mq msgsize !- 0)) 


err quit("must specify both -m maxmsg and -z msgsize"); 


mgd = Mq open(argv[optind], flags, FILE MODE, 
(attr.mq maxmsg !- 0) ? &attr : NULL); 


Mq close (mgd) ; 
exit(0); 


pxmsg/mqcreate.c 





图 5-5 改进 后 的 图 5-2， 人 允许 指定 属性 





指定 东 个 命令 行 选项 需要 一 个 参数 ， 我 们 在 getopt 调 用 中 给 这 些 选 


项 字 节 (m 和 z) 指定 了 一 个 后 跟 的 冒号 。 在 处 理 这 样 的 选项 字符 时 ， 
optarg 指 问 其 参数 。 


我 们 的 Getopt 包 里 函数 调用 标准 函数 库 中 的 getopt 函 数 ， 并 在 getopt 


检测 到 错误 时 终止 当前 进程 ， 这 些 错误 包括 : 过 到 一 个 没有 包含 在 
getopt 第 三 个 参数 中 的 选项 字母 ， 或 者 过 到 一 个 没有 所 需 参 数 的 选项 字 
(通过 在 getopt 的 第 三 个 参数 中 的 该 选项 字母 之 后 跟 一 个 冒号 指 

AN) 。 不 论 遇 到 哪 种 错误 ，getopt 都 将 一 个 出 错 消 妃 写 到 标准 错误 输 


出 ， 然 后 返回 一 个 错误 ， 这 个 错误 导致 我 们 的 Getopt 包 里 函数 终止 。 例 
如 ， 如 下 两 个 错误 由 getopt 检 测 出 。 
solaris 96 mqcreate -z 
mqcreate: option requires an argument -- z solaris 96 mqcreate -q 
macreate: illegal option -- q 


下 面 这 个 错误 《〈 没 有 指定 所 需 的 名 字 参 数 ) 则 由 我 们 的 程序 检测 





solaris 96 mqcreate 

usage: mqcreate [ -e | [ -m maxmsg -z msgsize | <name> 

如 有 果 这 两 个 新 的 命令 行 选项 都 没有 指定 ， 我 们 就 给 mq_open 传 递 一 
个 空 指针 作为 最 后 一 个 参数 ， 否 则 传递 一 个 根据 所 指定 命令 行 选项 的 参 
数 构 造 的 attr 结 构 。 

现在 运行 这 个 新 版 本 的 程序 ， 指 定 一 个 最 多 有 1024 个 消息 的 队列 ， 
每 个 消息 最 多 有 8192 个 字 节 。 

solaris % mqcreate -e -m 1024 -z 8192 /foobar 











solaris % ls -al /tmp/.*foobar 
-rw-rw-rw- 1 rstevens other1 8397336 Oct 25 11:29 /tmp/.MQDfoobar 


-rW-IW-IW- 1  rstevens otherl 0 Oct 25 11:29 
/tmp/.MQLfoobar 
-rw-r--r-- 1 rstevens other1 0 Oct 25 11:29 /tmp/.MQPfoobar 


含有 该 队列 之 数据 的 文件 C/tmp/.MQDfoobar) 其 大 小 能 容纳 最 大 
数目 的 最 长 消息 (1024x 8192= 8 388 608) ， 剩 余 的 8728 字 节 开 销 允 许 
每 个 消息 占用 8 个 字 节 (8024-8192 ， 外 加 536 个 字 节 。 

在 Digital Unix 4.0B 下 执行 同一 程序 的 结果 如 下 : 

alpha % mqcreate -m 256 -z 2048 /tmp/bigq 











alpha 96 Is -l /tmp/bigq 
-rw-r--r-- 1 rstevens system 537288 Oct 25 15:38 /tmp/bigq 





该 系统 上 的 实现 看 来 能 容纳 最 大 数目 的 最 长 消息 (256x2048-524 
288) ， 剩 余 的 13 000 字 节 开 销 允 许 每 个 消息 占用 48 个 字 节 (48x256 = 
12288) , »MI7124 5E s 





5.4 mq send 和 mg receive Z 


Xx WA AI PL BS Al T TS BA P] a — 1 TR A Pd FR C 
走 一 个 消息 。 每 个 消息 有 一 个 优先 级 ， 它 是 一 个 小 于 MQ_PRIO_MAX 
的 无 符号 整数 。Posix 要 求 这 个 上 限 至 少 为 32。 

Solaris 2.6 的 上 限 为 32，Digital Unix 4.0B 的 上 限 为 256。 我 们 将 随 图 
5-8 给 出 取得 该 上 限 值 的 方法 。 

mdq_receive 总 是 返回 所 指定 队列 中 最 高 优先 级 的 最 早 消息 ， 而 且 该 
优先 级 能 随 该 消息 的 内 容 及 其 长 度 一 同 返 回 。 

mq_receive 的 操作 不 同 于 Systme V 的 msgrcv (6.413) o System V 消 
轧 有 一 个 类 似 于 优先 级 的 类 型 字段 ， 但 使 用 msgrcv 时 ， 我 们 可 以 就 返回 
哪 一 个 消息 指定 三 种 不 同 的 情形 : 所 指定 队列 中 最 早 的 消息 、 有 具有 某 个 
寺 定 类 型 的 最 早 消 息 、 其 类 型 小 于 或 等 于 某 个 值 的 最 早 消息 。 


#include <mqueue.h> 











int mq send(mqd t mqdes, const char *ptr,size_t len,unsigned int prio); 
返回 : AMANO, A hEN- 

ssize t mq receive(mqd t mades,char *ptr,size_t len,unsigned int 

*priop); 
返回 : ARORA Pe, ae A-1 

这 两 个 函数 的 前 三 个 参数 分 别 与 write 和 read 的 前 三 个 参数 类 似 。 

把 指向 缓冲 区 的 指针 参数 定义 为 char* 看 来 是 个 错误 。 使 用 void* 将 
与 其 他 Posix.1 函 数 更 为 一 致 。 

mdq_receive 的 len 参 数 的 值 不 能 小 于 能 加 到 所 指定 队列 中 的 消息 的 最 


大 大 小 (该 队列 mq_attr 结 构 的 mq_msgsize 成 员 ) 。 要 是 len 小 于 该 值 ， 
md_receive 就 立即 返回 EMSGSIZE 错 误 。 

这 意味 着 使 用 Posix 消 息 队 列 的 大 多 数 应 用 程序 必须 在 打开 某 个 队 
列 后 调用 mq_getattr 确 定 最 大 消息 大 小 ， 然 后 分 配 一 个 或 多 个 那样 大 小 
的 读 缓冲 区 。 通 过 要 求 每 个 缓冲 区 总 是 足以 存放 队列 中 的 任意 消息 
mdq_receive 就 不 必 返 回 消 息 是 否 大 于 缓冲 区 的 通知 。 作为 比较 的 例子， 
System V 消 息 队 列 (6.4 节 ) 可 能 使 用 MSG_NOERROR 标 志 ， 返 回 
E2BIG 错 误 ， 接 收 UDP 数 据 报 的 recvmsg 函 数 CUNPvl 的 13.5 节 ) 可 能 使 
用 MSG_TRUNC 标 志 。 

mq_send 的 prio 参 数 是 符 发 送 消息 的 优先 级 ， 其 值 必须 小 于 
MQ_PRIO_MAX。 如 果 mq_receive 的 priop 参 数 是 一 个 非 空 指针 ， 所 返回 
消息 的 优先 级 就 通过 该 指针 存放 。 如 果 应 用 不 必 使 用 优先 级 不 同 的 消 
上 县， 那 就 给 mq_send 指 定 值 为 0 的 优先 级 ， 给 mq_receive 指 定 一 个 空 指 针 
作为 其 最 后 一 个 参数 。 

0 字 节 长 度 的 消息 是 允许 的 。 这 里 重要 的 不 是 标准 〈 即 Posix.1) 中 
说 的 内 容 ， 而 是 它 的 言 外 之 意 : 没有 地 方 可 以 禁止 使 用 0 字 节 长 度 的 消 
上 县。mq_receive 的 返回 值 是 所 接收 消息 中 的 字 节 数 《〈 如 果 成 功 ) 或 
-1 如果 出 错 ) ， 因 此 返回 值 为 0 表示 返回 长 度 为 0 的 消息 。 

Posix 消 息 队 列 和 System V 消 息 队 列 都 不 有 具备 的 一 个 特性 是 : 回 接 收 
者 准确 地 标识 每 条 消息 的 发 送 者 。 这 个 信息 在 许多 应 用 中 可 能 有 用 。 不 
笠 的 是 ， 大 多 数 IPC 消 息 机 制 并 不 标识 发 送 者 。 在 15.5 节 中 ， 我 们 将 讲 
述 门 如 何 提供 这 个 标识 。UNPvl 的 14.8 节 讲述 了 使 用 Unix 域 套 接 字 时 ， 
BSD/OS 如 何 提供 这 个 标识 。 pie [6] 讲述 了 通过 管道 传递 
描述 符 时 ，SVR4 如 何 通 过 同一 管道 传递 上 友 送 者 的 标识 。BSD/OS 技 术 没 
有 得 到 广泛 实现 ， SR 98 的 一 部 分 ， pean 
道 传递 描述 符 ， 这 通常 比 通过 管道 直接 传递 数据 开销 更 大 。 我 们 不 能 
发 送 者 随 消息 包含 自己 的 标识 (例如 有 效用 户 ID)》， 2 


























者 不 说 假 话 。 尽 管 消息 队列 的 访问 权限 决定 了 是 否 允 许 发 送 者 往 队 列 中 
放置 消息 ， 这 仍然 没有 标识 发 送 者 。 另 外 ， 尽 管 存在 为 每 个 发 送 者 创建 
一 个 队列 的 可 能 性 〈 对 此 我 们 将 在 6.8 节 束 System V 消 
论 ) ， 但 对 于 大 的 应 用 来 说 ， 这 种 方法 的 可 扩展 性 并 不 好 。 最 后 ， 要 是 
消息 队列 函数 完全 是 作为 用 户 函 数 实现 的 (5.8 节 中 的 实现 就 是 这 
样 ) ， 根 本 没 在 内 核 中 ， 那 么 我 们 不 能 信任 伴随 消息 的 任何 发 送 者 标 
识 ， 因 为 它 很 容易 伪造 。 
5.4.1 例子 : mqsend 程 序 
图 5-6 给 出 了 往 某 个 队列 中 增加 一 个 消息 的 mqsend 程 序 。 





恩 队 列 展开 讨 








pxmsg/mqsend.c 





1 #include "unpipc.h" 


2 int 


3 main(int argc, char **argv) 











5 mqd t mqd; 
6 void *ptr; 
7 size t len; 
8 uint t prio; 
图 5-6 mqsendf£ 
9 if (argc != 4) 
10 err quit ("usage: mqsend <name> <#bytes> <priority>") ; 
11 len = atoi(argv[2]); 
12 prio = atoi(argv[3]); 
13 mgd = Mq open(argv[1], O WRONLY) ; 
14 ptr = Calloc(len, sizeof (char) ) ; 
15 Mq_send(mqd, ptr, len, prio); 
16 exit (0) ; 
T7. i 


pxmsg/mqsend.c 





图 5-6 (E) 


竺 发送 消 息 的 大 小 和 优先 级 必须 作为 命令 行 参数 指定 
使 用 calloc 分 配 ， 该 函数 会 把 该 缓冲 区 初始 化 为 0。 

5.4.2 例子 : mqreceive 程 序 

图 5-7 中 的 程序 从 某 个 队列 中 读 入 下 一 个 消息 。 


。 所 用 缓冲 区 


pxmsg/mqreceive.c 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int c, flags; 

6 mgd t mqd; 

7 ssize tn; 

8 uint t prio; 

9 void *buff; 

10 struct mq attr attr; 

1 flags - O RDONLY; 

12 while ( (c = Getopt(argc, argv, "n")) !- -1) ( 
13 switch (c) ( 

14 case 'n': 

15 flags |= O NONBLOCK; 

16 break; 

dy } 

18 

19 if (optind != argc - 1) 

20 err quit ("usage: mqreceive [ -n ] <name>"); 
21 mqd = Mq open(argv[optind], flags); 

22 Mq getattr(mgd, &attr); 

23 buff - Malloc(attr.mq msgsize); 

24 n - Mq receive(mgd, buff, attr.mq msgsize, &prio); 
25 printf ("read $1d bytes, priority = %u\n", (long) n, prio); 
26 exit(0); 

27 |} 





pxmsg/mgreceive.c 
图 5-7 mgreceive 程 序 

允许 -mn 选项 以 指定 非 阻 塞 属性 

14~17 命令 行 选项 -n 指 定 非 阻 军属 性 ， 这 样 如 果 所 指定 队列 中 没有 
消息 ，mgqgreceive 程 序 就 返回 一 个 错误 。 

打开 队列 并 取得 属性 

21—25 调用 mq_getattr 打 开 队 列 并 取得 属性 。 我 们 需要 确定 最 大 消 
息 大 小 ， 因 为 必须 为 调用 mdq_receive 分 配 一 个 这 样 大 小 的 缓冲 区 。 最 后 
输出 所 该 出 消息 的 大 小 及 其 属性 。 

既然 n 是 一 个 size_t 数 据 类 型 ， 而 我 们 又 不 知道 size_t 是 int 还 是 long,， 
那么 要 使 用 %ld 格 式 化 串 将 n 类 型 强制 转换 成 一 个 长 整数 。 在 64 位 系统 
上 ，int 是 32 位 整数 ，long 和 size t 则 都 是 64 位 整数 。 


我 们 可 使 用 这 两 个 程序 来 得 看 优先 级 字段 是 如 何 使 用 的 。 
solaris % mqcreate /test1 创建 并 取得 属性 


solaris 96 mqgetattr /test1 





max #msgs = 128,max #bytes/msg = 1024, Zcurrently on queue = 0 


solaris % mqsend /test1 100 99999 以 无 效 的 优先 级 发 送 

mq send error: Invalid argument 

solaris 96 mqsend /test1 100 6 100 字 节 ， 优 先 级 为 6 

solaris 96 mqsend /test1 50 18 50 字 节 ， 优 先 级 为 18 

solaris 96 mqsend /test1 33 18 50 字 节 ， 优 先 级 为 18 

solaris 96 mqreceive /test1 

read 50 bytes,priority = 18 返回 优先 级 最 高 的 最 早 
TH fed. 


solaris 96 mqreceive /test1 

read 33 bytes,priority = 18 

solaris 96 mqreceive /test1 

read 100 bytes,priority = 6 

solaris 96 mqreceive-n /test1 指定 非 阻塞 属性 ， 队 
列 为 空 

mq_receive error: Resource temporarily unavailable 


可 以 看 出 ，mq_receive 返 回 优 先 级 最 高 的 最 早 消息 。 
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我 们 已 遇 到 任意 给 定 队 列 的 两 个 限制 ， 它 们 都 是 在 创建 该 队列 时 建 
AER 

mq mqxmsg 队列 中 的 最 大 消息 数 ; 

mq_msgsize ”给 定 消息 的 最 大 字 节 数 。 

















这 两 个 值 都 没有 内 在 的 限制 ， 尽 管 对 于 我 们 已 查看 过 的 两 种 实现 
(Solaris 2.6 和 Digital Unix 4.0B) 来 说 ， 大 小 为 这 两 个 数 之 积 再 加 少量 
开销 的 某 个 文件 在 文件 系统 中 必须 有 容纳 空间 。 基 于 队列 大 小 的 虚拟 内 
存 要 求 也 可 能 存在 〈 见 习题 5.5)。 

消息 队列 的 实现 定义 了 男 外 两 个 限制 : 

MQ OPEN MAX 一 个 进程 能 够 同时 拥有 的 打开 着 消息 队列 的 最 大 
数目 (Posix 要 求 它 至 少 为 8) ; 

MQ PRIO MAX 任意 消息 的 最 大 优先 级 值 加 1 〈Posix 要 求 它 至 少 为 
92 

这 两 个 常 值 往往 定义 在 <unistd.h> 头 文件 中 ， 也 可 以 在 运行 时 通过 
调用 sysconf 函 数 获取 ， 如 接 下 来 的 例子 所 示 。 

例子 : mqsysconf 程 序 

图 5-8 中 的 程序 调用 sysconf， 输 出 消息 队列 的 两 个 由 实现 定义 的 限 
制 。 

















pxmsg/mqsysconf.c 
1 #include "unpipc.h" 

2 unt 

3 main(int argc, char **argv) 

a 1 

5 printf("MQ OPEN MAX = $1d, MQ PRIO MAX = $1dWn", 

6 Sysconf( SC MQ OPEN MAX), Sysconf( SC MQ PRIO MAX)); 
7 exit(0); 
8 
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图 5-8 调用 sysconf 获 取消 息 队 列 限 制 
在 我 们 的 两 个 系统 上 执行 该 程序 的 结果 如 下 : 
solaris % mqsysconf 
MQ OPEN MAX = 32,MQ PRIO MAX = 32 
alpha % mqsysconf 
MQ OPEN MAX = 64,MQ PRIO MAX = 256 
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第 6 章 中 讨论 的 System V 消 息 队 列 的 问题 之 一 是 无 法 通知 一 个 进程 
何 时 在 某 个 队列 中 放置 了 一 个 消息 。 我 们 可 以 阻塞 在 msgrcv 调 用 中 ， 但 
那 将 阻止 我 们 在 等 竺 期间 做 其 他 任何 事 。 如 有 末 给 msgrcv 指 定 非 阻塞 标志 
(IPC_NOWAIT) ， 那 么 尽管 不 阻 蹇 了， 但 必须 持续 调用 该 函数 以 确定 
何 时 有 一 个 消息 到 达 。 我 们 说 过 这 称 为 轮 询 (polling) ， 是 对 CPU 时 间 
的 一 种 浪费 。 我 们 需要 一 种 方法 ， 让 系统 告诉 我 们 何 时 有 一 个 消息 放置 
到 了 先前 为 空 的 某 个 队列 中 。 

本 节 和 本 章 的 剩余 各 节 含 有 高 级 主题 ， 你 第 一 次 阅读 时 可 暂时 跳 过 
ae 

Posix 消 息 队 列 允 许 异 步 事件 通 知 Casynchronous event 
notification〉， 以 告知 何 时 有 一 个 消息 放置 到 了 某 个 空 消 恩 队 列 中 。 这 
种 通知 有 两 种 方式 可 供 选 择 : 

产生 一 个 信号 ; 

创建 一 个 线程 来 执行 一 个 指定 的 函数 。 

这 种 通知 通过 调用 mq_notify 建 立 。 


#include <mqueue.h> 














int mq notify(mqd t mqdes, const struct sigevent *notification); 
返回 : 知 成 功 则 为 0， 大 出 错 则 为 -1 
该 图 数 为 指定 队列 建立 或 删除 异步 事件 通知 。sigevent 结 构 是 随 
Posix.1 实 时 信号 新 加 的 ， 后 者 将 在 下 一 节 详 细 讨 论 。 该 结构 以 及 本 章 中 
引入 的 所 有 新 的 信号 相关 第 值 都 定义 在 <signal.h> 头 文件 中 。 
union sigval { 
int sival_int; /* integer value */ 
void *sival ptr; /* pointer value */ 


};struct sigevent { 


int sigev_notify; hs 
SIGEV_{NONE,SIGNAL,THREAD} */ 

int sigev_signo; /* signal number if 
SIGEV SIGNAL */ 

union sigval sigev. value; /* passed to signal handler or thread */ 

/* following two if SIGEV THREAD */ 

void (*sigev notify function)(union sigval); 

pthread attr t *sigev notify attributes; 

h 
我 们 马上 给 出 以 不 同方 法 使 用 异步 事件 通知 的 儿 个 例子 ， 但 在 此 前 
先 给 出 一 些 普遍 适用 于 该 函数 的 磊 干 规则 。 

(如 果 notification 参 数 非 空 ， 那 么 当前 进程 希望 在 有 一 个 消息 到 达 
所 指定 的 先前 为 空 的 队列 时 得 到 通知 。 我 们 说 “该 进程 被 注册 为 接收 该 
队列 的 通知 ”。 

(2) 如 果 notification 参 数 为 空 指针 ， 而 且 当 前 进程 目前 被 注册 为 接收 
所 指定 队列 的 通知 ， 那 么 已 存在 的 注册 将 被 撤销 。 

(3) 任 意 时 刻 只 有 一 个 进程 可 以 被 注册 为 接收 某 个 给 定 队 列 的 通知 。 

(4) 当 有 一 个 消息 到 达 某 个 先前 为 空 的 队列 ， 而 且 已 有 一 个 进程 被 注 
册 为 接收 该 队列 的 通知 时 ， 只 有 在 没有 任何 线程 阻 竖 在 该 队列 的 
mq_receive 调 用 中 的 前 提 下 ， 通 知 才 会 发 出 。 这 就 是 说 ， 在 mq_reveive 
调用 中 的 阻塞 比 任何 通知 的 注册 都 优先 。 

(5) 当 该 通知 被 发 送 给 它 的 注册 进程 时 ， 其 注册 即 被 撤销 。 该 进程 必 
须 再 次 调用 mq_notify 以 重新 注册 (如 果 想 要 的 话 ) 。 

Unix 信 号 最 初 的 问题 之 一 是 : 每 当 一 个 信号 产生 后 ， 其 行为 就 被 复 
位 成 默认 行为 (APUE 的 10.4 节 ) 。 信 号 处 理 程序 调用 的 第 一 个 函数 通 
常 是 signal， 用 于 重新 建立 处 理 程 序 。 这 么 一 来 提供 了 一 个 短 的 时 间 窗 
口 ， 它 处 于 该 信号 的 产生 与 当前 进程 重建 其 信号 处 理 程序 之 间 ， 这 段 时 











间 内 再 次 产生 的 同一 信号 可 能 终止 当前 进程 。 初 看 起 来 ，mq_notify 似 乎 
有 类 似 的 问题 ， 因 为 当前 进程 必须 在 每 次 通知 发 生 后 重新 注册 。 然 而 消 
息 队列 不 同 于 信和 号， 因为 在 队列 变 空前 通知 不 会 再 次 发 生 。 因 此 我 们 必 
须 小 心 ， 保 证 在 从 队列 中 读 出 消息 之 前 《而 不 是 之 后 ) 重新 注册 。 

5.6.1 例子 : 简单 的 信号 通知 

在 深入 探讨 Posix 实 时 信号 和 线程 之 前 ， 我 们 可 以 编写 一 个 简单 的 
程序 ， 当 有 一 个 消息 放置 到 某 个 空 队列 中 ， 该 程序 产生 一 个 SIGUSR1 信 
号 。 图 5-9 给 出 了 这 个 程序 ， 注 意 它 含 有 一 个 我 们 不 和 久 后 将 详细 讨论 的 
HER e 

声明 全 局 变量 
2~6 声明 main 函 数 和 信号 处 理 程 序 Csig_usr1) 都 使 用 的 一 些 全 局 
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打开 队列 ， ge 分 配 读 绥 冲 区 
12—15 ”打开 通过 命令 行 参数 指定 的 消息 队列 ， 获 取 其 属性 ， 然 后 
分 配 一 个 读 缓冲 区 。 

建立 信号 处 理 程 序 ， 局 用 通知 

16~20 首先 给 SIGUSR1 建 立信 号 处 理 程 序 。 在 sigevent 结 构 的 
sigev_notify 成 员 中 填 入 SIGEV_SIGNAL 常 值 ， 其 意思 是 当 所 指定 队列 由 
空 变 为 非 空 时 ， 我 们 希望 有 一 个 信号 会 产生 。 将 sigev_signo 成 员 设 置 成 
硕 望 产生 的 信号 后 ， 调 用 mq_notify。 

无 限 循 环 

21—22 _ main 函数 接 下 来 是 个 无 限 睡 眠 在 pause 函 数 中 的 循环 ， 该 函 
数 每 次 捕获 一 个 信号 时 都 会 返回 -1。 

捕获 信号 ， 读 出 消息 

25~33 ”我 们 的 信号 处 理 程序 调用 mq_notify 以 便 为 下 一 个 事件 重新 
注册 ， 然 后 读 出 消息 并 输出 其 长 度 。 本 程序 中 我 们 忽略 了 接收 到 的 消息 
的 优先 级 。 
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Ui FWD 


#include "unpipc.h" 
mgd t mqd; 

void *buff; 

struct mq attr attr; 
struct sigevent sigev; 


static void sig usrl(int); 
int 
main(int argc, char **argv) 
{ 
LE (argc !s 2) 
err quit("usage: mqnotifysigl <name>") ; 


/* open queue, get attributes, allocate read buffer */ 
mqd = Mq open(argv[1], O RDONLY); 
Mq getattr(mgd, &attr); 
buff - Malloc(attr.mq msgsize); 


/* establish signal handler, enable notification */ 
Signal(SIGUSR1, sig usrl); 
sigev.sigev notify = SIGEV SIGNAL; 
Sigev.sigev signo = SIGUSR1; 
Mq notify (mgd, &sigev) ; 


Bow 65 39 
pause () ; /* signal handler does everything */ 
exit(0); 


) 


static void 
sig usrl(int signo) 


ssize t n; 


Mq notify (mgd, &sigev); /* reregister first */ 

n = Mq receive(mqd, buff, attr.mq msgsize, NULL); 
printf("SIGUSR1 received, read $1d bytes\n", (long) n); 
return; 





E], 


pxmsg/mqnotifysig 1.c 


图 5-9 当 有 消息 放置 到 某 个 空 队 列 中 时 产生 SIGUSR1〔 不 正确 版 本 ) 


sig_usr1 结 束 处 的 return 语 句 不 是 必要 的 ， 因 为 并 没有 返回 值 需 返 
而 且 抒 出 该 函数 的 末尾 也 是 一 个 向 调用 者 的 隐 式 返回 。 然 而 作者 总 
会 在 信号 处 理 程序 的 末尾 写 上 一 个 显 式 的 retum 语 句 ， 目 的 是 为 了 强调 
从 这 种 函数 的 返回 是 特殊 的 。 它 可 能 会 导致 处 理 该 信号 的 线程 中 某 个 孙 
数 调用 过 早 返回 〈 返 回 一 个 EINTR 错 误 ) 

我 们 现在 从 一 个 窗口 运行 这 个 程序 : 

solaris % mqcreate /test1 创建 队列 


启动 图 5-9 中 的 程序 


solaris % mqnotifysig1 /test1 
从 另外 一 个 窗口 中 执行 如 下 命令 : 
solaris 96 mqsend /test1 50 16 


16 的 消息 
正如 所 料 ， 程 序 mynotifysig1 输 出 : “SIGUSR1  reveived,read — 50 


发 送 50 字 节 优 先 级 为 


bytes”. 
我 们 可 以 验证 每 次 只 有 一 个 进程 可 被 注册 为 接收 通知 ， 方 法 是 从 另 
一 个 窗口 中 局 动 该 程序 的 男 一 个 副本 : 

solaris % mqnotifysig1 /test1 

mq notify error: Device busy 

这 个 出 错 消息 对 应 EBUSY 错 误 。 

5.6.2 Posix 信 号 : 异步 信号 安全 函数 

图 5-9 中 程序 的 问题 是 它 从 信号 处 理 程序 中 调用 mq_notify、 
mq_receive 和 printf。 这 些 函 数 实 际 上 都 不 可 PAIR S 守 处 理 程序 中 调用 。 

Posix 使 用 异步 信号 安全 〈async-signal-safe) 这 一 术语 描述 可 以 从 信 
号 处 理 程序 中 调用 的 函数 。 图 5-10 列 出 了 这 些 Posix 函 数 以 及 由 Unix 98 


加 上 的 其 他 几 个 函数 。 





access 
aio_return 
aio_suspend 
alarm 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
chdir 

chmod 

chown 

clock gettime 
close 

creat 

dup 

dup2 

execle 

execve 


exit 
fcntl 
fdatasync 
fork 


fpathconf 
fstat 
fsync 
getegid 
geteuid 
getgid 
getgroups 
getpgrp 
getpid 
getppid 
getuid 
kill 
link 
lseek 
mkdir 
mkfifo 
open 
pathconf 
pause 
pipe 
raise 
read 


rename 
rmdir 

sem post 
setgid 
setpgid 
setsid 
setuid 
sigaction 
sigaddset 
sigdelset 
sigemptyset 
sigfillset 
sigismember 
signal 
sigpause 
sigpending 
sigprocmask 
sigqueue 
sigset 
sigsuspend 
sleep 

stat 





sysconf 
tcdrain 
tcflow 
tcflush 
tcgetattr 
tcgetpgrp 
tcsendbreak 
tcsetattr 
tcsetpgrp 
time 

timer getoverrun 
timer gettime 
timer settime 
times 

umask 

uname 

unlink 

utime 

wait 

waitpid 
write 





图 5-10 异步 信号 安全 的 函数 


没有 列 在 该 表 中 的 函数 不 可 以 从 信号 处 理 程序 中 调用 。 注 意 所 有 标 
准 WO 函 数 和 pthread_XXX 函 数 都 没有 列 在 其 中 。 本 书 所 涵盖 的 所 有 IPC 
函数 中 ， 只 有 sem_post、read 和 write 列 在 其 中 〈 我 们 假定 read 和 write 可 
用 于 管道 和 FIFO) 。 

ANSI C 列 出 了 可 以 从 信号 处 理 程 序 中 调用 的 四 个 函数 : abort. 
exit、longjmp 和 和 signal。Unix 98 没 有 把 前 三 个 函数 列 为 异步 信号 安全 函 
数 。 

5.6.3 例子 : 信号 通知 

避免 从 信号 处 理 程序 中 调用 任何 函数 的 方法 之 一 是 : 让 处 理 程序 仅 
仅 设置 一 个 全 局 标志 ， desea ain 以 确定 何 时 接收 到 一 个 消 
恩 。 图 5-11 展 示 了 这 种 技巧 ， 不 过 和 它 含 有 另外 一 个 错误 ， 我 们 不 久 会 讲 


到 。 

全 局 变量 

2 既然 信号 处 理 程 序 执行 的 唯一 操作 十 把 mdqflag 置 为 非 零 ， 于 是 图 
5-9 中 的 全 局 变量 不 必 仍 然 是 全 局 变量 。 降 低 全 局 变量 的 数目 肯定 是 一 
种 好 技巧 ， 当 使 用 线程 时 尤为 如 此 。 





pxmsg/mqnotifysig2.c 
1 #include "unpipc.h" 


2 volatile sig atomic t mgflag; /* set nonzero by signal handler */ 
3 static void sig usrl(int); 


4 int 

5 main(int argc, char **argv) 

6 { 

7 mqd t mqd; 

8 void *buff; 

9 ssize t n; 

10 sigset t zeromask, newmask, oldmask; 

11 struct mq attr  attr; 

12 struct sigevent sigev; 

13 if (argc !- 2) 

14 err quit("usage: mqnotifysig2 <name>") ; 

15 /* open queue, get attributes, allocate read buffer */ 
16 mqd = Mq_open(argv[1], O RDONLY) ; 

17 Mq_getattr(mqd, &attr) ; 

18 buff = Malloc(attr.mq_msgsize) ; 

19 Sigemptyset (&zeromask) ; /* no signals blocked */ 

20 Sigemptyset (&newmask) ; 

21 Sigemptyset (&oldmask); 

22 Sigaddset (&newmask, SIGUSR1) ; 

23 /* establish signal handler, enable notification */ 
24 Signal (SIGUSR1, sig usrl); 

25 sigev.sigev_notify = SIGEV_SIGNAL; 

26 sigev.sigev_signo = SIGUSR1; 

27 Mq_notify(mqd, &sigev) ; 

28 fö (rl 

29 Sigprocmask (SIG BLOCK, &newmask, &oldmask); /* block SIGUSR1 */ 
30 while (mqflag == 0) 

31 sigsuspend (&zeromask) ; 

32 mqflag = 0; /* reset flag */ 

33 Mq notify(mgd, &sigev) ; /* reregister first */ 
34 n = Mq receive (mqd, buff, attr.mq_msgsize, NULL); 
35 printf ("read $1d bytes\n", (long) n); 

36 Sigprocmask(SIG UNBLOCK, &newmask, NULL); /* unblock SIGUSR1 */ 
37 } 

38 exit (0); 

39 } 


40 static void 
41 sig usrl(int signo) 


42 ( 

43 mqflag = 1; 
44 return; 

45 } 
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图 5-11 信号 处 理 程序 只 是 给 主线 程 设置 一 个 标志 (不 正确 版 本 ) 
打开 消息 队列 


15—18 ”打开 通过 命令 行 参数 指定 的 消息 队列 ， 获 取 其 属性 ， 然 后 
分 配 一 个 读 缓冲 区 。 

初始 化 信号 集 

19~22 初始 化 三 个 信号 集 ， 并 在 newmask 集 中 打开 对 应 SIGUSR1 的 
位 。 

建立 信号 处 理 程 序 ， 启 用 通知 

23—27 给 SIGUSR1 建 立 一 个 信号 处 理 程序 ， 填 写 sigevent 结 构 ， 调 
用 mq_notify。 

等 待 信号 处 理 程 序 设置 标志 

28~32 ”调用 sigprocmask 阻 塞 SIGUSR1， 并 把 当前 信号 捧 码 保存 到 
oldmask 中 。 随 后 在 一 个 循环 中 测试 全 局 变量 mqflag， 以 等 待 信号 处 理 
程序 将 它 设置 成 非 零 。 只 要 它 为 0， 我 们 就 调用 sigsuspend， 它 原子 性 地 
将 调用 线程 投入 睡眠 ， 并 把 它 的 信和 号 掩 码 复位 成 zeromask “(没有 一 个 信 
号 被 阻塞 ) 。APUE 的 10.16 市 详细 讨论 sigsuspend 以 及 为 什么 只 能 在 
SIGUSR1 被 阻塞 时 测试 mqflag 变 量 。 每 次 sigsuspend 返 回 时 ，SIGUSR1 
被 重新 阻塞 。 

重新 注册 并 读 出 消息 

33—36 当 mdqflag 为 非 零 时 ， 重 新 注册 并 从 指定 队列 中 读 出 消息 。 随 
后 给 SIGUSR1 解 阻 堵 并 返回 for 循 环 顶 部 。 

我 们 提 到 过 这 种 办 法 仍 存在 一 个 问题 。 考 虑 一 下 第 一 个 消息 被 读 出 
之 前 有 两 个 消息 到 达 的 情形 。 我 们 可 通过 在 mq_notify 调 用 前 增加 一 个 
sleep 语 句 来 模拟 这 种 情形 。 这 里 的 基本 问题 是 : 通知 只 是 在 有 一 个 消息 
被 放置 到 某 个 空 队 列 上 时 才 发 出 。 如 果 在 能 够 读 出 第 一 个 消息 前 有 两 个 
消息 到 达 ， 那 么 只 有 一 个 通知 被 发 出 : 我 们 于 是 读 出 第 一 个 消息 ， 并 调 
用 sigsuspend 等 待 男 一 个 消息 ， 而 对 应 它 的 通知 可 能 永远 不 会 发 出 。 在 
此 期 间 ， 另 一 个 消息 已 放置 于 该 队列 中 等 待 读 出 ， 而 我 们 却 一 直 在 忽略 
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5.6.4 例子 : 使 用 非 阻 塞 mq_receive 的 信号 通知 


上 述 问题 的 解决 办 法 是 : 当 使 用 mq_notify 产 生 信 号 时 ，， 
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1 #include "unpipc.h" 


2 volatile sig atomic t mqflag; /* set nonzero by signal handler */ 


3 static void sig_usrl (int); 


4 int 


5 main(int argc, char **argv) 


6 { 


mqd t mqd; 

void *buff; 

ssize t n; 

Sigset t zeromask, newmask, oldmask; 
struct mq attr attr; 

struct sigevent sigev; 


if (argc !- 2) 
err quit("usage: mgnotifysig3 <name>"); 


/* open queue, get attributes, allocate read buffer */ 
mqd = Mq open(argv[1], O RDONLY | O NONBLOCK); 
Mq getattr(mgd, &attr); 
buff - Malloc(attr.mq msgsize); 


Sigemptyset (&zeromask) ; /* no signals blocked */ 
Sigemptyset (&newmask) ; 
Sigemptyset (&oldmask); 
Sigaddset (&newmask, SIGUSR1) ; 

/* establish signal handler, enable notification */ 
Signal (SIGUSR1, sig_usr1) ; 
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图 5-12 使 用 信号 通知 读 Posix 消 息 队 列 





25 sigev.sigev notify = SIGEV SIGNAL; 


26 sigev.sigev signo = SIGUSR1; 

27 Mq_notify(mqd, &sigev) ; 

28 For (FY ft 

29 Sigprocmask(SIG BLOCK, &newmask, &oldmask); /* block SIGUSR1 */ 
30 while (mqflag == 0) 

31 sigsuspend (&zeromask) ; 

32 mqflag = 0; /* reset flag */ 

33 Mq_notify(mqd, &sigev) ; /* reregister first */ 

34 while ( (n = mq_receive(mqd, buff, attr.mq_msgsize, NULL)) >= 0) { 
35 printf ("read $1d bytes\n", (long) n); 

36 } 

37 if (errno != EAGAIN) 

38 err sys("mq receive error"); 

39 Sigprocmask(SIG UNBLOCK, &newmask, NULL); /* unblock SIGUSR1 */ 
40 } 

41 exit (0); 

42 } 


43 static void 
44 sig usrl(int signo) 


45 ( 

46 mqflag = 1; 
47 return; 
48 } 





pxmsg/mqnotifysig3.c 


图 5-12 (HD 


打开 消息 队列 以 非 阻塞 模 式 

15—18 第 一 个 变动 是 在 打开 消息 队列 时 指定 O_NONBLOCK 标 志 。 

从 队列 中 读 出 所 有 消息 

34~38 男 一 个 变动 是 在 一 个 循环 中 调用 mq_receive， 处 理 队 列 中 的 
每 个 消息 。 返 回 一 个 EAGAIN 错 误 不 表示 有 问题 ， 它 只 是 意味 着 暂时 没 
有 消息 可 读 。 

5.6.5 例子 : 使 用 sigwait 代 蔡 信 号 处 理 程序 的 信号 通知 

上 一 个 例子 尽管 正确 ， 但 效率 还 可 以 更 高 些 。 我 们 的 程序 通过 调用 
sigsuspend 阻 塞 ， 以 等 竺 某 个 消息 的 到 达 。 当 有 一 个 消息 被 放置 到 某 个 
空 队列 中 时 ， 该 信号 产生 ， 主 线程 被 阻止 ， 信 号 处 理 程序 执行 并 设置 
mqflag 变 量 ， 主 线程 再 次 执行 ， 发 现 mq_flag 为 非 零 ， 于 是 读 出 该 消息 。 
更 为 简易 ‘并 且 可 能 更 为 高 效 ) 的 办 法 之 一 是 阻塞 在 某 个 函数 中 ， 仅 仅 

















等 待 该 信号 的 递交 ， 而 不 是 让 内 核 执行 一 个 只 为 设置 一 个 标志 的 信号 处 
理 程序 。sigwait 提 供 了 这 种 能 力 。 

#include <signal.h> 

int sigwait(const sigset_t *set,int *sig); 

返回 : ERDO, A BEREE 

调用 sigwait 订 ， 我 们 阻塞 茶 个 信号 集 。 我 们 将 这 个 信号 集 指定 为 set 
参数 。sigwait 然 后 一 直 阻 塞 到 这 些 信 号 中 有 一 个 或 多 个 竺 处理， 这 时 它 
返回 其 中 一 个 信和 号。 该 信号 值 通 过 指针 sig 和 存放， 函数 的 返回 值 则 为 0。 
这 个 过 程 称 为 “同步 地 等 待 一 个 异步 事件 ”:， 我 们 是 在 使 用 信号 ， 但 没有 
涉及 异步 信号 人 处理 程序 。 

图 5-13 给 出 了 用 到 sigwait 时 mq_notify 的 使 用 。 
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1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int signo; 

6 mqd t mad; 

7 void *buff; 

8 ssize t n; 

9 sigset t newmask ; 
10 struct mq attr attr; 
11 struct sigevent sigev; 
12 if (arge != 2) 
13 err quit ("usage: mqnotifysig4 <name>"); 
14 /* open queue, get attributes, allocate read buffer */ 
15 mqd = Mq open(argv[1], O RDONLY | O NONBLOCK) ; 
16 Mq getattr(mgd, &attr); 
17 buff - Malloc(attr.mq msgsize); 
18 Sigemptyset (&newmask) ; 

19 Sigaddset (&newmask, SIGUSR1) ; 
20 Sigprocmask(SIG BLOCK, &newmask, NULL); /* block SIGUSR1 */ 
21 /* establish signal handler, enable notification */ 
22 Sigev.sigev notify - SIGEV SIGNAL; 
23 Sigev.sigev signo = SIGUSR1; 
24 Mq notify (mgd, &sigev); 
25 for (55274 
26 Sigwait(&newmask, &signo); 
27 if (signo -- SIGUSR1) { 
28 Mq notify (mgd, &sigev); /* reregister first */ 
29 while ( (n = mq receive(mqd, buff, attr.mq msgsize, NULL)) >= 0) { 
30 printf ("read $1d bytes\n", (long) n); 

31 } 

32 if (errno != EAGAIN) 

33 err sys("mq receive error"); 
34 } 

35 } 

36 exit (0); 
aT ) 
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5-13 伴随 sigwait 使 用 mq_notify 


初始 化 信号 集 并 阻 堵 SIGUSR1 
18 一 20 把 茶 个 信号 集 初 始 化 成 只 含有 SIGUSR1， 然 后 用 
sigprocmask 阻 蹇 该 信号 。 


等 


AS RE fe JA 


inu 


26~ 34 在 sigwait 调 用 中 阻塞 并 等 待 该 信号 。SIGUSR1 被 递交 后 ， 重 


新 注册 通知 并 读 出 所 有 可 用 消息 。 

sigwait 往 往 在 多 线程 化 的 进程 中 使 用 。 实 际 上 ， 看 一 看 它 的 函数 原 
型 ， 我 们 会 发 现 其 返回 值 或 为 0， 或 为 某 个 Exxx 错 误 ， 这 与 大 多 数 
Pthread 函 数 一 样 。 但 是 在 多 线程 化 的 进程 中 不 能 使 用 sigprocmask， 而 必 
须 调用 pthread_sigmask， 它 只 是 改变 调用 线程 的 信号 撼 码 。 
pthread_sigmask 的 参数 与 sigprocmask 的 相同 。 

sigwait 存 在 两 个 变种 : sigwaitinfo 和 sigtimedwait。sigwaitinfo 还 返回 
一 个 siginfo_{t 结 构 《〈 将 在 下 一 节 中 定义 ) ， 目 的 是 用 于 可 靠 信 号 中 。 
sigtimedwait 也 返回 一 个 siginfo_t 结 构 ， 并 人 允许 调用 者 指定 一 个 时 间 限 
制 |。 

大 多 数 讨 论 线程 的 书 〈 例 如 [Butenhof 1997] ) 推荐 在 多 线程 化 的 
进程 中 使 用 sigwait 来 处 理 所 有 信和 号， 而 绝 不 要 使 用 异步 信号 处 理 程序 。 

5.6.6 例子 : 使 用 select 的 Posix 消 息 队 列 

消息 队列 描述 符 (mgd CERTO 不 是 “普通 ”描述 符 ， 它 不 能 用 在 
select 或 poll CUNPv1 第 6 章 ) 中 。 然 而 我 们 可 以 伴随 一 个 管道 和 
mdqd_notify 函 数 使 用 它们 。 《我 们 将 在 6.9 节 中 随 System  V 消 息 队 列 展示 
类 似 的 技巧 ， 那 时 涉及 的 是 一 个 子 进程 和 一 个 管道 。) 首先 ， 从 图 5-10 
注意 到 write 函数 是 异步 信号 安全 的 ， 因 此 可 以 从 信和 号 处 理 程序 中 调用 
它 。 图 5-14 给 出 了 我 们 的 程序 。 























1 #include "unpipc.h" 


2 ant 


pipefd[2]; 


3 static void sig usrl (int); 


4 int 


5 main(int argc, char **argv) 


6 { 
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11 
12 
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14 


Js 
16 
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18 
£9 
20 


21 


22 
23 
24 
25 
26 


27 
28 
29 
30 


31 
32 


int nfds; 
char [er] 

fd set rset; 
mqd_t mqd; 


void *puff; 

ssize t n; 

struct mq attr  attr; 
struct sigevent sigev; 


if (argc != 2) 
err quit("usage: mgnotifysig5 «name»"); 


/* open queue, get attributes, allocate read buffer */ 
mqd - Mq open(argv[1], O RDONLY | O NONBLOCK); 
Mq getattr(mgd, &attr); 
buff - Malloc(attr.mq msgsize); 


Pipe (pipefd) ; 


/* establish signal handler, enable notification */ 
Signal (SIGUSR1, sig usrl); 
sigev.sigev_notify = SIGEV_SIGNAL; 
sigev.sigev_signo = SIGUSR1; 
Mq_notify(mqd, &sigev) ; 


FD ZERO(&rset); 
for 63 hg { 
FD SET(pipefd[0], &rset); 
nfds = Select(pipefd[0] + 1, &rset, NULL, NULL, NULL); 


if (FD ISSET(pipefd[0], &rset)) ( 
Read(pipefd[0], &c, 1); 





图 5-14 伴随 管道 使 用 信号 通知 
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33 Mq_notify(mqd, &sigev) ; /* reregister first */ 


34 while ( (n = mq receive(mgd, buff, attr.mq_msgsize, NULL)) >= 0) { 
35 printf ("read %1d bytes\n", (long) n); 

36 

37 if (errno != EAGAIN) 

38 err_sys("mq_receive error") ; 

39 } 

40 } 

41 exit (0); 

42 } 


43 static void 
44 sig usrl(int signo) 





45 ( 
46 Write(pipefd[1], "", 1); /* one byte of 0 */ 
47 return; 
48 ) 
pxmsg/mqnotifysig5.c 
图 5-14 CÈ) 
mo YET 
创建 一 个 管道 


21 创建 一 个 管道 ， 当 接收 到 消 妃 队列 的 录 步 事件 通知 时 ， 信 和 号 处 
理 程序 就 会 往 该 管道 中 写 入 数据 。 这 是 一 个 管道 用 于 信号 处 理 程 序 中 的 
例子 。 





调用 select 
27~40 “初始 化 描述 符 集 rset， 每 次 循环 时 打开 对 应 于 pipefd[0] CE 
道 的 读 出 端 ) 的 那 一 位 。 然 后 调用 select 只 等 待 该 描述 符 ， 不 过 在 典型 





的 应 用 中 ， 这 儿 是 多 个 描述 符 上 的 输入 或 输出 复 用 的 地 方 。 当 管道 的 读 
出 端 可 读 时 ， 重 新 注册 消息 队列 的 通知 ， 并 读 出 所 有 可 得 的 消息 。 
言 写 处 理 程序 
43~48 我 们 的 信号 处 理 程序 只 是 往 管 道 write 1 个 字 节 。 我 们 已 提 及 
这 是 一 个 异步 信号 安全 的 操作 。 
5.6.7 例子 : 启动 线程 
异步 事件 通知 的 另 一 种 方式 是 把 sigev_notify 设 置 成 
SIGEV_THREAD， 这 会 创建 一 个 新 的 线程 。 该 线程 调用 由 
sigev notify function 指 定 的 函数 ， 所 用 的 参数 由 sigev_value 指 定 。 新 线 








程 的 线程 属性 由 sigev_notify_attributes 指 定 ， 要 是 默认 属性 合适 的 话 ， 
它 可 以 是 一 个 空 指针 。 图 5-15 给 出 了 使 用 这 种 技术 的 一 个 例子 。 

我 们 把 给 新 线程 的 参数 Csigev value) 指定 成 一 个 空 指针 ， 因 此 不 
会 有 任何 东西 传递 给 该 线程 的 起 始 函 数 。 我 们 能 以 参数 的 形式 传递 一 个 
指向 所 处 理 消息 队列 描述 符 的 指针 ， 而 不 是 把 它 声明 为 一 个 全 局 变量 ， 
不 过 新 线程 仍然 需要 消息 队列 属性 和 sigev 结 构 ( 以 便 重新 注册 ) 。 我 们 
把 给 新 线程 的 属性 指定 成 一 个 空 指针 ， 因 此 使 用 的 是 系统 默认 属性 。 这 
样 的 新 线程 是 作为 脱离 的 线程 创建 的 。 

遗憾 的 是 ， 本 书 例子 所 用 的 两 个 系统 (Solaris 2.6 和 Digital Unix 
4.0B) 没有 一 个 支持 SIGEV_THREAD。 这 两 个 系统 都 要 求 sigev_notify 
或 者 为 SIGEV_NONE， 或 者 为 SIGEV_SIGNAL。 
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1 #include "unpipc.h" 


2 mgd t mgd; 
3 struct mq attr  attr; 
4 struct sigevent sigev; 


5 static void notify thread(union sigval); /* our thread function */ 


int 


{ 


6 
7 main(int argc, char **argv) 
8 
9 


if (argo l= 2) 


10 err quit ("usage: mqnotifythreadl <name>"); 
Il mqd = Mq open(argv[1], O RDONLY | O NONBLOCK); 
12 Mq getattr(mgd, &attr); 

13 sigev.sigev notify = SIGEV THREAD; 

14 sigev.sigev value.sival ptr - NULL; 

15 Sigev.sigev notify function = notify thread; 
16 sigev.sigev notify attributes - NULL; 

17 Mq notify (mgd, &sigev); 

18 for (ra) 

19 pause (); /* each new thread does everything */ 
20 exit (0); 

2g } 


22 static void 
23 notify thread(union sigval arg) 


24 ( 

25 ssize t n; 

26 void *buff; 

27 printf ("notify thread started\n") ; 

28 buff = Malloc(attr.mq_msgsize) ; 

29 Mq_notify(mqd, &sigev) ; /* reregister */ 
30 while ( (n = mq receive(mqd, buff, attr.mq msgsize, NULL)) >= 0) { 
E printf ("read $1d bytes\n", (long) n); 
32 } 

33 if (errno != EAGAIN) 

34 err_sys("mq_receive error") ; 

35 free (buff); 

36 pthread exit (NULL); 

37 } 
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图 5-15 启动 一 个 新 线程 的 mq_notify 


5.7 Posix 实 时 信号 


在 过 去 几 十 年 中 ，Unix 信 和 号 经 历 了 多 次 重大 的 演变 。 
(1) 由 Version 7 Unix (1978 年 ) 提供 的 信号 模型 是 不 可 靠 的 。 信 号 


可 能 丢失 ， 而 且 进 程 难 以 在 执行 临界 代码 段 时 关 掉 选中 的 若干 信号 。 

(24.3BSD (1986 年 ) 增加 了 可 靠 的 信号 。 

(3)System V Release 3.0 (19864F) 也 增加 了 可 靠 的 信号 ， 不 过 不 同 
于 BSD 模 型 。 

(4)Posix.] (19904F) 标准 化 了 BSD 可 靠 信 号 模型 ，APUE 的 第 10 章 
详细 讲述 了 该 模型 。 

(5)Posix.1 (1996) 给 Posix 模 型 增加 了 实时 信号 。 该 工作 起 源 于 
Posix.lb 实 时 扩展 《以 前 称 为 Posix.4) 。 

当今 几乎 每 种 Unix 系 统 都 提供 Posix 可 靠 信 号 ， 更 新 的 系统 正在 逐 
步 提 供 Posix 实 时 信号 。 《在 描述 信号 时 ， 注 意 区 分 可 靠 和 实时 。) 我 
们 有 必要 较 详 细 地 讨论 实时 信号 ， 因 为 已 在 上 一 节 中 使 用 过 由 这 个 扩展 
定义 的 一 些 结构 〈sigval 结 构 和 sigevent 结 构 ) 。 

言 号 可 划分 为 两 个 大 组 。 

(1 其 值 在 SIGRTMIN 和 SIGRTMAX 之 间 〈 包 括 两 者 在 内 ) 的 实时 
信号 。Posix 要 求 至 少 提供 RTSIG_MAX 种 实时 信号 ， 而 该 常 值 的 最 小 值 
为 8。 

(2) 所 有 其 他 信号 : SIGALRM、SIGINT、SIGKILL 等 。 

Solaris ”2.6 上 普通 Unix 信 号 的 值 为 1 一 37，8 种 实时 信号 的 值 为 38 一 
45. Digital Unix 4.0B 上 普通 Unix 信 和 号 的 值 为 1 一 32，16 种 实时 信号 的 值 
为 33 一 48。 这 两 种 实现 都 把 SIGRTMIN 和 SIGRTMAX 定 义 为 调用 sysconf 
的 宏 ， 以 允许 在 将 来 修改 它们 的 值 。 

接 下 去 我 们 关注 接收 某 个 信号 的 进程 的 sigaction 调 用 中 是 否 指定 了 
新 的 SA_SIGINFO 标 志 。 这 些 差 寞 带 来 了 图 5-16 中 所 示 的 四 种 可 能 情 
用 


























sigaction 调 用 


SA_SIGINFO 已 指定 SA _SIGINFO 未 指定 


SIGRTMIN 到 SITGRTMRX 实时 行为 有 保证 实时 行为 未 指定 
所 有 其 他 信号 实时 行为 未 指定 实时 行为 未 指定 





图 5-16 Posix 信 号 实时 行为 ， 取 决 于 SA_SIGINFO 

其 中 有 三 个 框 标 以 “实时 行为 未 指定 ”"， 其 含义 是 有 些 实现 可 能 提供 
实时 行为 ， 有 些 实现 可 能 不 提供 。 如 果 需 要 实时 行为 ， 我 们 必须 使 用 
SIGRTMIN 和 SIGRTMAX 之 间 的 新 的 实时 信号 ， 而 且 在 安装 信号 处 理 程 
序 时 必须 给 sigaction 指 定 SA_SIGINFO 标 志 。 

术语 实时 行为 (realtime behavior) 隐 含 着 如 下 特征 。 

言 号 是 排队 的 。 这 就 是 说 ， 如 果 同 一 信号 产生 了 三 次 ， 它 就 递交 三 
次 。 另 外 ， 一 种 给 定 信号 的 多 次 发 生 以 先进 先 出 〈FIFO) 顺序 排队 。 我 
们 不 久 将 给 出 一 个 信号 排队 的 例子 。 

对 于 不 排队 的 信号 来 说 ， 产 生 了 三 次 的 某 种 信号 可 能 只 递交 一 次 。 

当 有 多 个 SIGRTMIN 到 SIGRTMAX 范 围 内 的 解 阻塞 信号 排队 时 ， 值 
较 小 的 信号 先 于 值 较 大 的 信号 递交 。 这 就 是 说 ，SIGRTMIN 比 值 为 
SIGRTMIN+1 的 信号 “更 为 优先 ”， 值 为 SIGRTMIN+1 的 信号 比值 为 
SIGRTMIN+2 的 信号 “更 为 优先 ”， 依 此 类 推 。 

当 某 个 非 实 时 信号 递交 时 ， 传 递 给 它 的 信号 处 理 程 序 的 唯一 参数 是 
该 信号 的 值 。 实 时 信号 比 其 他 信和 号 携带 更 多 的 信息 。 通 过 设置 
SA_SIGINFO 标 志 安装 的 任意 实时 信号 的 信号 处 理 程序 声明 如 下 : 

void func(int signo,siginfo_t *info,void *context); 

其 中 signo 是 该 信号 的 值 ，siginfo_t 结 构 则 定义 如 下 : 

typedef struct { 




















int Si signo; /* same value as signo argument */ 


int sj code; rin 


SI_{USER,QUEUE, TIMER,ASYNCIO,MEGEQ} */ 
union sigval si value; /* integer or pointer value from sender 
*/ 
} siginfo_t; 
context 参 数 所 指向 的 内 容 依赖 于 实现 。 
技术 上 讲 ， 非 实时 Posix 信 号 的 处 理 程序 只 用 一 个 参数 调用 。 许 多 
系统 有 一 个 较 早 的 使 用 三 个 参数 的 约定 ， 适 用 于 先 于 Posix 实 时 标准 的 
言 号 处 理 程 序 。 
siginfo_t 是 使 用 typedef 定 义 的 具有 以 _t 结 尾 的 名 字 的 唯一 一 个 Posix 
结构 。 图 5-17 中 我 们 把 指向 这 些 结 构 的 指针 声明 为 siginfo_t*， 而 不 出 现 
struct 一 词 [7] 。 
一 些 新 函数 定义 成 使 用 实时 信号 工作 。 例 如 ，sigqueue 函 数 用 于 代 
蔡 kill 函 数 癌 茶 个 进程 发 送 一 个 信号 ， 该 新 函数 允许 发 送 者 随 所 发 送信 
号 传递 一 个 sigval 联 合 。 
实时 信号 由 下 列 Posix.1 特 性 产生 ， 它 们 由 包含 在 传递 给 信号 处 理 程 
序 的 siginfo_t 结 构 中 的 si_code 值 来 标识 。 
SI ASYNCIO 信号 由 某 个 异步 WO 请 求 的 完成 产生 ， 这 些 异 步 1/O 请 
求 就 是 Posix 的 aio_XXX 函 数 ， 我 们 不 讲述 。 
SI_MESGQ 信号 在 有 一 个 消 恩 被 放置 到 茶 个 空 消息 队列 中 时 产生 ， 
如 5.6 节 中 所 述 。 
SI QUEUE 信号 由 sigqueue 函 数 发 出 。 稍 后 我 们 将 给 出 一 个 这 样 的 
例子 。 
SI TIMER ”信号 由 使 用 timer_settime 函 数 设置 的 某 个 定时 器 的 到 时 
产生 .我们 不 讲述 s 
SI USER 信号 由 kill 函 数 发 出 。 
如 采信 号 是 由 某 个 其 他 事件 产生 的 ，si_code 就 会 被 设置 成 不 同 于 这 
里 所 列 的 某 个 值 。siginfo_t 结 构 的 si_value 成 员 的 内 容 只 在 si_code 为 


SI_ASYNCIO、SI_MESGQ、SI_QUEUE 或 SI_TIMER 时 才 有 效 。 

5.7.1 例子 

图 5-17 是 一 个 演示 实时 信和 号 的 简单 程序 。 该 程序 调用 fork， 子 进程 
阻塞 三 种 实时 信号 ， 父 进程 随后 发 送 9 个 信号 (三 种 实时 信号 中 每 种 3 
个 ) ， 子 进程 接着 解 阻塞 信号 ， 我 们 于 是 看 到 每 种 信号 各 有 多 少 个 递交 
以 及 它们 的 先后 递交 顺序 。 

输出 实时 信号 值 

10 ”输出 最 小 和 最 大 实时 信号 值 ， 以 查看 系统 实现 支持 多 少 种 实时 
言 号 。 我 们 把 这 两 个 弟 值 类 型 强制 转换 成 一 个 整数 ， 因 为 有 些 实现 把 这 
两 个 种 值 定 义 为 调用 sysconf 的 宏 ， 例 如 : 

#define SIGRTMAX (sysconf(_SC_RTSIG_MAX)) 

而 sysconf 返 回 一 个 长 整数 〈 见 习题 5.4) 。 

fork: 子 进程 阻塞 三 种 实时 信号 

11—17 派生 一 个 子 进程 ， 由 子 进 程 调用 sigprocmask 阻 塞 我 们 将 使 
用 的 三 种 实时 信号 : SIGRTMAX、SIGRTMAX-1、SIGRTMAX-2。 


























1 #include "unpipc.h" 


2 static void sig rt(int, siginfo t *, void *); 


rtsignals/testl.c 


3 int 

4 main(int argc, char **argv) 

5 { 

6 int Xy jj 

g pid t pid; 

8 sigset t newset; 

9 union sigval val; 

10 printf("SIGRTMIN = %d, SIGRTMAX = %d\n", (int) SIGRTMIN, (int) SIGRTMAX) ; 
TT if ( (pid = Fork()) == 0) { 

12 /* child: block three realtime signals */ 

13 Sigemptyset (&newset) ; 

14 Sigaddset (&newset, SIGRTMAX) ; 

15 Sigaddset (&newset, SIGRTMAX - 1); 

16 Sigaddset (&newset, SIGRTMAX - 2); 

a Sigprocmask (SIG BLOCK, &newset, NULL); 

18 /* establish signal handler with SA SIGINFO set */ 

19 Signal rt(SIGRTMAX, sig rt, &newset); 

20 Signal rt(SIGRTMAX - 1, sig rt, &newset); 

21 Signal rt(SIGRTMAX - 2, sig rt, &newset); 

22 sleep (6) ; /* let parent send all the signals */ 
23 Sigprocmask (SIG UNBLOCK, &newset, NULL); /* unblock */ 

24 sleep (3) ; /* let all queued signals be delivered */ 
25 exit (0); 

26 } 

27 /* parent sends nine signals to child */ 

28 sleep(3); /* let child block all signals */ 
29 for (i = SIGRTMAX; i »- SIGRTMAX - 2; i--) ( 

30 for (j = 0; j <= 2; j++) { 

31 val.sival_int = j; 

32 Sigqueue (pid, i, val); 

33 printf ("sent signal %d, val = d\n", i, j); 

34 } 

35 } 

36 exit (0); 

37 } 


38 static void 
39 sig rt(int signo, siginfo t *info, void *context) 


40 ( 

41 printf ("received signal #%d, code = $d, ival = %d\n", 
42 signo, info->si_code, info-»si value.sival int); 
43 ) 


rtsignals/testl.c 








图 5-17 演示 实时 信号 的 简单 测试 程序 


建立 信号 处 理 程 序 


18~21 调用 signal_rt 函 数 〈 将 在 图 5-18 中 给 出 ) ， 建 立 我 们 的 sig_rt 
函数 来 作为 这 三 种 实时 信和 号 的 处 理 程序 。 该 函数 设置 SA_SIGINFO 标 
志 ， 再 加 上 这 三 种 信号 都 是 实时 信号 ， 于 是 我 们 预期 它们 有 具备 实时 行 

。 该 函数 还 设置 执行 信号 处 理 程序 期 间 需 阻塞 的 信号 掩 码 [8] 。 

等 待 父 进程 产生 信号 ， 然 后 解 阻 罕 信 号 

22~25 等 待 6 秒 以 允许 父 进程 产生 预定 的 9 个 信号 。 然 后 调用 
sigprocmask 解 阻塞 那 三 种 实时 信号 。 该 操作 应 允许 所 有 排队 的 信号 都 被 
递交 。 子 进程 停顿 另外 3 秒 ， 以 便 信号 处 理 程序 调用 Printf 9 次 ， 然 后 终 
ds 

父 进程 发 送 9 个 信和 号 

27~36 父 进程 停顿 3 秒 ， 以 便 子 进程 阻塞 所 有 信和 号。 父 进程 随后 给 
那 三 种 实时 信号 的 第 一 种 产生 3 个 信号 : i 取 这 三 种 实时 信号 的 值 ， 对 于 
每 个 i 值 ，j 取 值 为 0(、1 和 2。 我 们 特意 从 最 高 的 信号 值 开 始 产生 信和 号 ， 
为 期 竺 它们 从 最 低 的 信号 值 开始 递交 。 我 们 还 伴随 每 个 信号 发 送 一 个 不 
同 的 整数 值 〈sival_int) ， 以 验证 一 种 给 定 信号 的 3 次 发 生 是 按 FIFO 的 顺 
序 产生 的 。 

言 号 处 理 程序 

38 一 43 我 们 的 信号 处 理 程序 只 是 输出 所 递交 信号 的 有 关 信 息 。 

我 们 从 图 5-10 注 意 到 printf 不 是 异步 信号 安全 的 ， 因 而 不 能 从 信和 号 处 
理 程 序 中 调用 。 在 这 儿 的 小 测试 程序 中 ， 我 们 将 它 作为 一 个 简单 的 诊断 
工具 来 调用 。 [9] 

我 们 首先 在 Solaris ”2.6 下 运行 该 程序 ， 但 是 发 现 它 的 输出 与 我 们 预 
期 的 不 一 致 。 

solaris 96 test1 

SIGRTMIN = 38,SIGRTMAX = 45 提供 8 种 实 
时 信和 号 
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xx ILA SY 


父 进程 现在 发 送 9 个 信号 
sent signal 45,val = 0 sent signal 45,val = 1 
sent signal 45,val = 2 
sent signal 44,val = 0 
static volatile siginfo_t arrival[10]; 
static volatile int nsig; 
然后 让 信号 处 理 程 序 在 该 数组 中 保存 其 imfo 参 数 : 
static void 
sig_rt(int signo,siginfo_t *info,void *context) 
{ 
arrival[nsig++] = *info; /* save info for child to print */ 
j 
最 后 由 子 进程 在 终止 前 输出 该 数组 中 的 信息 : 
sleep(3); /* let all queued signals be delivered */ 
for (i = 0; i < nsig; i++){ 
printf("received signal #%d,code = %d,ival = %d\n", 
arrival[i].si_signo, arrival[i].si_code, 
arrival[i].si value.sival int); 
j 
exit(0); 
sent signal 44,val = 1 
sent signal 44,val = 2 
sent signal 43,val = 0 
sent signal 43,val = 1 
sent signal 43,val = 2 
solaris 96 父 进程 终止 ，shel 提 示 
符 输 出 


在 子 进程 解 阻塞 信和 号 


前 停顿 3 秒 
received signal #45,code = -2,ival = 2 子 进 程 捕获 信和 号 


received signal #45,code = -2,ival = 1 

received signal #45,code = -2,ival = 0 

received signal #44,code = -2,ival = 2 

received signal #44,code = -2,ival = 1 

received signal #44,code = -2,ival = 0 

received signal #43,code = -2,ival = 2 

received signal #43,code = -2,ival = 1 

received signal #43,code = -2,ival = 0 

父 进 程 发 送 的 9 个 信号 排 了 队 ， 但 是 那 三 种 信号 是 从 值 最 大 的 信和 号 
开始 产生 的 《而 我 们 却 期 竺 值 最 小 的 信号 最 先 产 生 ) 。 对 于 一 种 给 定 信 
号 ， 它 的 3 个 排 了 队 的 信号 看 来 是 以 LIFO 顺 序 而 不 是 FIFO 顺 序 递交 的 。 
值 为 -2 的 si_code 对 应 SI_QUEUE。 

接着 改 在 Digital Unix 4.0B 下 运行 该 程序 ， 我 们 看 到 了 预期 的 结果 。 











alpha % test1 
SIGRTMIN = 33,SIGRTMAX = 48 提供 16 种 实时 信和 号 
这 儿 停 顿 3 秒 
sent signal 48,val = 
0 父 进 程 现 在 发 送 9 个 
信号 


sent signal 48,val = 1 
sent signal 48,val = 

sent signal 47,val = 0 
sent signal 47,val = 1 


sent signal 47,val = 2 


终止 


sent signal 46,val = 0 
sent signal 46,val = 1 


sent signal 46,val = 2 


alpha % 父 进 程 
，Shell 提 示 符 输出 

在 子 进程 解 阻 塞 信号 前 停顿 3 秒 
received signal #46,code = -l,ival = 0 子 进 程 捕获 信和 号 


received signal #46,code = -1,ival = 1 


received signal #46,code = -1,ival = 2 
received signal #47,code = -1,ival = 0 
received signal #47,code = -1,ival = 1 
received signal #47,code = -1,ival = 2 
received signal #48,code = -1,ival = 0 
received signal #48,code = -1,ival = 1 
received signal #48,code = -1,ival = 2 


父 进程 发 送 的 9 个 信号 排队 后 按 我 们 期 符 的 顺序 递交 : 值 最 小 的 信 





号 最 先 递 交 ， 对 于 一 种 给 定 信号 ， 它 的 3 次 发 生 按 FIFO 顺 序 递交 


Solaris 2.6 的 实现 看 来 存在 缺陷 。 
5.7.2 signal. rte Zt 
我 们 在 UNPv1 第 120 页 给 出 了 自己 的 signal 函 数 ， 它 调用 Posix 


， 印 数 建立 一 个 提供 可 靠 Posix 语 义 的 信号 处 理 程序 。 现 在 我 们 把 


函数 修改 成 提供 实时 行为 。 我 们 称 这 个 新 函数 为 signal_rt， 如 网 5-18 


à 





lib/signal_rt.c 
1 #include "unpipc.h" 


2 Sigfunc rt * 

3 signal rt(int signo, Sigfunc rt *func, sigset-t *mask) 

4 d 

5 struct sigaction act, oact; 

6 act.sa sigaction - func; /* must store function addr here */ 
7 act.sa mask - *mask; /* signals to block */ 

8 act.sa flags - SA SIGINFO; /* must specify this for realtime */ 
9 if (signo == SIGALRM) { 

10 #ifdef SA INTERRUPT 

11 act.sa flags |- SA INTERRUPT; /* SunOS 4.x */ 

12 #endif 

13 ) eise ( 

14 #ifdef SA RESTART 

I5 act.sa_flags |= SA _ RESTART; /* SVR4, 44BSD */ 

16 #endif 

17 } 

18 if (sigaction(signo, &act, &oact) < 0) 

19 return ((Sigfunc_rt *) SIG ERR); 

20 return (oact.sa_sigaction) ; 

21. 5} 





lib/signal_rt.c 














图 5-18 提供 实时 行为 的 signal_rt 函 数 


使 用 typedef 简 化 函数 原型 

1—3 在 我 们 的 unpipc.h 头 文件 〈 图 C-1) 中 ，Sigfunc_ rt 定义 如 下 : 

typedef void Sigfunc_rt(int,siginfo_t *,void *); 

我 们 在 本 节 早 先 说 过 ， 这 是 在 设置 SA_SIGINFO 标 志 的 前 提 下 安装 
的 信号 处 理 程序 的 函数 原型 。 

指定 处 理 程 序 函 数 

5~7 加 入 实时 信号 支持 后 ，sigaction 发 生变 化 ， 即 增加 了 新 的 


sa_sigaction 成 员 。 








struct sigaction { 
void (*sa_handler)(); /* SIG_DFL,SIG_IGN,or add of signal handler 
*/ 
sigset t sa mask; /* additional signals to block */ 
int sa flags; /* signal options: SA, xxx */ 


void (*sa_sigaction)(int,siginfo_t,void *); 


/* addr of signal handler if SA_SIGINFO set */ 

h 

规则 如 下 。 

如 果 在 sa_flags 成 员 中 设置 了 SA_SIGINFO 标 志 ， 那 么 sa_sigaction 成 
员 会 指定 信号 处 理 函 数 的 地 址 。 

如 果 在 sa_flags 成 员 中 没有 设置 SA_SIGINFO 标 志 ， 那 么 sa_handler 
成 员 会 指定 信号 处 理 函 数 的 地 址 。 

为 给 某 个 信号 指定 默认 行为 或 忽略 该 信号 ， 应 把 sa_handler 设 置 为 
SIG_DFL 或 SIG_IGN， 并 且 不 设置 SA_SIGINFO 标 志 。 

设置 SA_SIGINFO 

8 一 17 我 们 总 是 设置 SA_SIGINFO 标 志 ， 如 果 信 号 不 是 SIGALRM， 
那 就 再 指定 SA_RESTART 标 志 。 























我 们 现在 提供 一 个 使 用 内 存 映 射 TO 以 及 Posix 互 斥 锁 和 条 件 变量 完 
成 的 Posix 消 息 队 列 的 实现 。 

我 们 在 第 7 章 中 讨论 互 斥 锁 和 条 件 变量 ， 在 第 12 章 和 第 13 章 中 讨论 
内 存 映射 TO。 你 可 能 希望 跳 过 本 节 ， 阅 读 过 所 列 各 章 后 再 返回 来 。 

图 5-19 展 示 了 我 们 用 于 实现 Posix 消 息 队 列 的 各 种 数据 结构 的 布局 。 
该 图 中 我 们 假设 创建 出 的 消息 队列 最 多 容纳 4 个 消息 ， 每 个 消 轧 7 个 字 
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内 存 映 射 区 起 始 位 置 
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mq_attr{} 















mq_info{} 
mq hart) sigevent () 


mqi_magic 


mqi_flags 
BS tatcm dee 


对 消息 队列 的 每 次 mq_open 
对 应 这 样 一 个 结构 






mqh_lock 


7 字 节 数据 ， 
1 字 节 填充 
7 字 节 数据 ， 


一 个 消息 
1 字 节 填充 






pthread_mutex_t 






pthread_cond_t 





msg_hdr{} 







msg_hdr{} 


















7 字 节 数据 ， 
1 字 节 填充 
7 字 节 数据 ， 
1 字 节 填充 i i 
地- 一 内 存 映射 区 结束 位 置 
UP 
每 个 消息 队列 对 应 一 个 内 存 映 射 文件 


图 5-19 使 用 内 存 映射 文件 实现 Posix 消 息 队列 的 各 种 数据 结构 的 布局 
图 5-20 给 出 了 我 们 的 mqueue.h 头 文件 ， 它 定义 了 本 实现 的 基本 结 


msg_hdr{} 







msg_hdr{} 
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构 。 





my_pxmsg_mmap/mqueue.h 
1 typedef struct mq info *mgd t;  /* opaque datatype */ 


2 struct mq attr { 

3 long mq flags; /* message queue flag: O NONBLOCK */ 

4 long mq maxmsg; /* max number of messages allowed on queue */ 
5 long mq msgsize; /* max size of a message (in bytes) */ 

6 long mq curmsgs; /* number of messages currently on queue */ 
7 }; 

8 /* one mq hdr() per queue, at beginning of mapped file */ 

9 struct mq_hdr { 

10 struct mq attr mqh attr; /* the queue's attributes */ 

TI long mqh_head; /* index of first message */ 

12 long mqh free; /* index of first free message */ 

13 long mgh nwait; /* #threads blocked in mq receive() */ 

14 pid t  mqgh pid; /* nonzero PID if mgh event set */ 

15 struct sigevent mgh event;  /* for mq notify() */ 

16 pthread mutex t mgh lock; /* mutex lock */ 

A7 pthread cond t mqh wait; /* and condition variable */ 

18: pz 

19 /* one msg hdr(] at the front of each message in the mapped file */ 
20 struct msg hdr ( 

221 long msg_next; /* index of next on linked list */ 

22 /* msg_next must be first member in struct */ 

23 ssize_t msg_len; /* actual length */ 

24 unsigned int msg_prio; /* priority */ 

25 }; 

26 /* one mq_info{} malloc'ed per process per mq_open() */ 

27 struct mq_info { 

28 struct mq hdr *mqi hdr; /* start of mmap'ed region */ 

29 long mqi magic; /* magic number if open */ 

30 int mqi flags; /* flags for this process */ 

31 }; 

32 #define MQI MAGIC 0x98765432 

33 /* size of message in file is rounded up for alignment */ 

34 #define MSGSIZE(i) ((((i) + sizeof(long)-1) / sizeof(long)) * sizeof (long) ) 





my_pxmsg_mmap/mqueue.h 


图 5-20 mqueue.h3- x: fF 


mad tZ 2578 

1 REENA 4s BÀ PU TRAN E He — dH IRL SE mq. info£ PARS RT - 
次 调用 mq_open 都 会 分 配 一 个 这 种 结构 ， 其 指针 就 返回 给 调用 者 。 这 一 
点 再 次 强调 了 消息 队列 摘 述 符 不 必 像 文件 描述 符 那 样 是 一 个 小 整数 一 一 
唯一 的 Posix 要 求 是 这 种 数据 类 型 不 能 是 一 个 数组 类 型 。 

mq_hdr 结 构 

8 一 18 该 结构 出 现在 映射 文件 的 开头 ， 含 有 针对 每 个 队列 的 所 有 信 





恩 。mq_attr 结 构 的 mq_flags 成 员 没 有 用 上 ， 因 为 标志 唯一 定义 了 的 是 
非 阻塞 标志 ) 必须 以 每 次 打开 为 基 而 不 是 以 每 个 队列 为 基 来 维护 。 也 就 
是 说 ， 标 志 在 mq_info 结 构 中 维护 。 该 结构 的 其 余 成 员 随 它们 在 各 种 函 
数 中 的 使 用 而 说 明 。 

现在 开始 注意 ， 我 们 称 之 为 索引 Cindex) 的 任何 东西 〈 本 结构 的 
mqh_head 和 mqh_free 成 员 ， 下 一 个 结构 的 msg_next 成 员 〉 都 含有 从 映射 
文件 头 开 始 的 字 节 索引 。 举 例 来 说 ，Solaris ”2.6 下 mdq_hdr 结 构 的 大 小 为 
96 字 市 ， 因 此 该 首部 之 后 第 一 个 消息 的 索引 为 96。 图 5-19 中 的 每 个 消息 
占据 20 字 节 〈12 字 节 的 msg_hdr 结 构 和 8 字 节 的 消 上 息 数据 ) ， 因 此 其 余 三 
个 消息 的 索引 分 别 为 116、136 和 156， 该 映射 文件 的 大 小 为 176 字 节 。 这 
些 索引 用 于 维护 映射 文件 中 的 两 个 链表 : 一 个 链表 (mqh head) 含有 当 
前 在 队列 中 的 所 有 消息 ， 男 一 个 链表 (Ongh free) 含有 队列 中 的 所 有 空 
内 消息 。 我 们 不 能 给 这 些 链表 指针 使 用 真正 的 内 存 指针 (地址) ， 因 为 
同一 映射 文件 在 映射 它 的 各 个 进程 中 可 以 在 不 同 的 内 存 地 址 开始 (如 图 
13-6 所 示 ) 。 

msg_hdr 结 构 

19~25 “该 结构 出 现在 映射 文件 中 每 个 消息 的 开头 。 所 有 消息 要 人 么 
在 消息 链表 中 ， 要 么 在 空闲 链表 中 ，msg_next 成 员 合 有 本 链表 中 下 一 个 
消息 的 索引 《〈 如 采 本 消息 为 所 在 链表 最 后 一 个 消息 ， 那 么 下 一 个 消息 的 
索引 为 0) 。msg_len 是 消息 数据 的 真正 长 度 ， 对 于 图 5-19 中 的 例子 来 
说 ， 它 可 以 在 0 一 7 字 节 之 间 〈 包 括 0 和 7) 。msg_prio 是 由 mq_send 的 调 
用 者 赋予 消息 的 优先 级 。 

mq_info 结 构 

26~32 每 次 打开 一 个 队列 时 ，mq_open 会 动态 分 配 一 个 这 种 结构 ， 
它 由 mq_close 释 放 。 

mqi_hdr 指 辣 映射 文件 (由 mmap 返 回 的 起 始 地 址 )。 我 们 的 实现 中 
的 基本 数据 类 型 mqd_t 就 是 指 同 该 结构 的 指针 ， 该 指针 是 mq_open 的 返 
































回 值 。 

一 旦 mq_info 结 构 初 始 化 ， 其 mqi_magic 成 员 便 含 有 MQL MAGIC, 
被 传递 以 一 个 mqd_t 指 针 的 每 个 函数 都 检查 该 成 员 ， 以 确信 该 指针 确实 
指向 一 个 mq_info 结 构 。mqi_flags 成 员 含 有 当前 队列 的 本 次 打开 实例 的 
非 阻塞 标志 。 

MSGSIZEZ: 

33—34 ”为 了 对 齐 ， 我 们 希望 映射 文件 中 的 每 个 消息 从 一 个 长 整数 
边界 开始 。 因 此 ， 如 果 每 个 消息 的 最 大 大 小 不 是 这 样 对 齐 的 ， 我 们 就 得 
给 每 个 消息 的 数据 部 分 增加 1 一 3 个 填充 字 节 ， 如 网 5-19 所 示 。 这 里 假设 
长 整数 的 大 小 为 4 字 节 (对 于 Solaris 2.6 来 说 是 正确 的 ) ， 但 是 如 果 长 整 
数 的 大 小 为 8 字 节 (Digit Unix 4.0 上 就 是 这 样 ) ， 那 么 填充 字 节 数 在 1 一 
7 之 间 。 

5.8.1 mq openiX Zi 

图 5-21 给 出 了 mq_open 函 数 的 第 一 部 分 ， 它 创建 一 个 新 消息 队列 或 
打开 一 个 已 存在 的 消息 队列 。 

处 理 可 变 长 度 参 数 表 

29—32 ”本 函数 能 够 以 两 个 或 四 个 参数 调用 ， 这 取决 于 是 否 指定 了 
O_CREAT 标 志 。 当 指定 了 该 标志 时 ， 第 三 个 参数 的 类 型 为 mode_t， 它 
是 一 个 基本 的 系统 数据 类 型 ， 可 以 是 任意 类 型 的 整数 。 我 们 遇 到 的 问题 
是 在 BSD/OS 上 ， 它 把 该 数据 类 型 定义 为 unsigned ^ short 整数 (占据 16 
位 ) 。 既 然 该 实现 上 的 整数 要 占据 32 位 ， 而 且 参 数 表 中 的 所 有 短 整 数 都 
被 扩展 成 整数 ， 那 么 C 编 译 器 会 把 这 种 类 型 的 参数 从 16 位 扩展 到 32 位 。 
但 是 如 果 在 va_arg 调 用 中 指定 mode_t， 那 它 将 会 在 栈 中 走 过 16 位 后 便 指 
向 下 一 个 参数 ， 然 而 本 参数 已 被 扩展 为 占据 32 位 。 为 此 我 们 必须 定义 自 
己 的 数据 类 型 va_mode_t， 它 在 BSD/OS 下 是 整数 ， 在 其 他 系统 下 是 类 型 
mode_t。 我 们 的 unpipc.h 头 文件 〈 图 C-1) 中 的 如 下 各 行 处 理 这 个 移植 性 


问题 : 




















#ifdef . bsdi . 


#define va modet int 
#define va mode t mode t 
#else 

#endif 


30 我 们 关 掉 mode 变 量 中 的 用 户 执行 位 (S_IXUSR) ， 其 原因 稍 后 





my_pxmsg_mmap/mq_open.c 
1 #include "unpipc.h" 
2 #include "mqueue.h" 


3 #include <stdarg.h> 
4 #define MAX TRIES 10 /* for waiting for initialization */ 


5 struct mq attr defattr = 
6 (0, 128, 1024, 0 }; 


7 mgd t 

8 mq open(const char *pathname, int oflag, ...) 

9 { 

10 int i, fd, nonblock, created, save_errno; 

T long msgsize, filesize, index; 

12 va list ap; 

13 mode t mode; 

14 int8 t *mptr; 

15 struct stat statbuff; 

16 struct mq hdr *mghdr ; 

17 struct msg hdr *msghdr; 

18 struct mq attr *attr; 

19 struct mq info  *mginfo; 

20 pthread mutexattr t mattr; 

21 pthread condattr t cattr; 

22 created - 0; 

23 nonblock - oflag & O NONBLOCK; 

24 oflag &- -O NONBLOCK; 

25 mptr - (int8 t *) MAP FAILED; 

26 mqinfo = NULL; 

27 again: 

28 if (oflag & O CREAT) { 

29 va_start (ap, oflag); /* init ap to final named argument */ 
30 mode = va arg(ap, va mode t) & ~S_IXUSR; 

31 attr - va arg(ap, struct mq attr *); 

32 va end(ap); 

33 /* open and specify O EXCL and user-execute */ 
34 fd - open(pathname, oflag | O EXCL | O RDWR, mode | S IXUSR); 
35 if (£d < 0) ( 

36 if (errno == EEXIST && (oflag & O EXCL) == 0) 
m7 goto exists; /* already exists, OK */ 
38 else 

39 return((mgd t) -1); 

40 ) 

41 created - 1; 

42 /* first one to create the file initializes it */ 
43 if (attr -- NULL) 

44 attr - &defattr; 

45 else ( 

46 if (attr-»mq maxmsg <= 0 || attr-»mq msgsize <= 0) { 
47 errno - EINVAL; 

48 goto err; 

49 } 

50 } 


my_pxmsg_mmap/mq_open.c 





图 5-21 mq_open 函 数 : 第 一 部 分 


创建 一 个 新 消息 队列 
33—34 ”按照 由 调用 者 指定 的 名 字 创 建 一 个 普通 文件 ， 并 打开 它 的 





用 户 执行 位 。 

处 理 潜在 的 竞争 状态 

35—40 “要 是 我 们 只 是 打开 该 文件 ， 内 存 映 射 其 内 容 ， 并 在 调用 者 
中 定 O_CREAT 标 志 的 前 提 下 初始 化 映射 文件 〈 如 稍 后 所 述 ) ， 就 会 碰 
到 一 个 竞争 状态 。 一 个 消息 队列 只 在 调用 者 指定 了 O_CREAT 标 志 并 且 
该 消息 队列 原本 不 存在 时 才 会 由 mq_open 初 始 化 。 这 意味 着 我 们 需要 某 
种 方法 来 检测 消息 队列 是 否 存在 。 为 此 我 们 总 是 在 open 由 调用 者 给 定 的 
内 存 映射 文件 时 指定 O_EXCL 标 志 。 但 是 只 有 调用 者 指定 了 O_EXCL 标 
志 时 ， 来 和 目 open 的 EEXIST 出 错 返 回 才 会 成 为 出 目 mq_open 的 错误 。 人 否 
则 ， 如 果 open 返 回 一 个 EEXIST 错 误 ， 那 说 明 由 调用 者 给 定 的 文件 已 经 
存在 ， 我 们 就 向 前 跳 到 图 5-23， 仿 佛 未 曾 指 定 过 O_CREAT 标 志 。 

可 能 出 现 竞争 状态 是 因为 使 用 一 个 内 存 映射 文件 代表 一 个 消息 队列 
需要 两 个 步骤 来 初始 化 一 个 新 的 消息 队列 : 首先 必须 使 用 open 创 建 该 文 
件 ， 其 次 必须 初始 化 该 文件 的 内 容 〈 稍 后 描述 ) 。 如 果 有 两 个 线程 〈 可 
以 在 同一 进程 或 不 同 进程 中 ) 几乎 同时 调用 mq_open， 问 题 束 会 及 生 。 
一 个 线程 创建 该 文件 ， 然 后 系统 在 该 线程 完成 初始 化 之 前 切换 到 第 二 个 
线程 。 第 二 个 线程 检测 到 该 文件 已 存在 (使 用 O_EXCL 标 志 open) ， 于 
是 立即 尝试 使 用 该 消息 队列 。 不 过 只 有 在 第 一 个 线程 初始 化 消息 队列 
后 ， 它 才能 被 使 用 。 

我 们 使 用 该 文件 的 用 户 执行 位 来 指示 该 消息 队列 尚未 初始 化 。 该 位 
只 能 由 真正 创建 该 文件 的 线程 启用 (使 用 O_EXCL 标 志 检 测 是 否 由 本 线 
程 创 建 了 该 文件 ) ， 这 个 线程 随后 初始 化 该 消息 队列 ， 并 关 掉 用 户 执行 
位 。 我 们 在 图 10-43 和 图 10-52 中 还 将 遇 到 类 似 的 竞争 状态 。 

检查 属性 

42~50 如 果 调 用 者 给 mq_open 的 最 后 一 个 参数 指定 了 一 个 空 指针 ， 
我 们 就 使 用 图 5-21 开 始 处 给 出 的 默认 属性 : 128 个 消息 ， 每 个 消 轧 1024 
字 节 。 如 果 调 用 者 指定 了 属性 ， 我 们 就 验证 mq_maxmsg 和 mq_msgsize 为 














正 数 。 


mq_open 函 数 的 第 二 部 分 在 图 5-22 中 给 出 ; 它 完成 一 个 新 队列 的 初 


始 化 。 
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my pxmsg mmap/mq open.c 
/* calculate and set the file size */ 
msgsize - MSGSIZE(attr-»mq msgsize); 
filesize = sizeof (struct mq hdr) + (attr-»mq maxmsg * 
(sizeof(struct msg hdr) + msgsize)); 


if (lseek(fd, filesize = 1, SEEK SET) == -1) 
goto err; 

i£ (write(fd, "", 1) sz -1) 
goto err; 


/* memory map the file */ 
mptr - mmap(NULL, filesize, PROT READ | PROT WRITE, 
MAP SHARED, fd, 0); 
if (mptr -- MAP FAILED) 
goto err; 


/* allocate one mq info() for the queue */ 
if ( (mginfo - malloc(sizeof(struct mq info))) -- NULL) 


goto err; 
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图 5-22 mq open A ÁE — 304): 完成 新 队列 的 初始 化 











67 mqinfo->mqi_hdr = mghdr = (struct mq hdr *) mptr; 


68 mqinfo-»mqi magic = MOI MAGIC; 

69 mginfo-»mqgi flags = nonblock; 

70 /* initialize header at beginning of file */ 

TE /* create free list with all messages on it */ 

72 mghdr->mgh_attr.mq_flags = 0; 

73 mghdr-»mgh attr.mq maxmsg = attr-»mq maxmsg; 

74 mghdr-»mgh attr.mq msgsize = attr-»mq msgsize; 

75 mghdr-»mqh attr.mqg curmsgs = 0; 

76 mghdr-»mqgh nwait = 0; 

my mghdr-»mgh pid - 0; 

78 mghdr-»mgh head = 0; 

79 index = sizeof (struct mq hdr); 

80 mqhdr->mqh free = index; 

81 for (i = 0; i < attr->mq_maxmsg - 1; i++) { 

82 msghdr = (struct msg hdr *) &mptr [index] ; 

83 index += sizeof (struct msg hdr) + msgsize; 

84 msghdr-»msg next = index; 

85 } 

86 msghdr = (struct msg hdr *) &mptr [index] ; 

87 msghdr-»msg next = 0; /* end of free list */ 

88 /* initialize mutex & condition variable */ 

89 if ( (i = pthread mutexattr init(&mattr)) != 0) 

90 goto pthreaderr; 

91 pthread mutexattr setpshared(&mattr, PTHREAD PROCESS SHARED); 
92 i = pthread mutex init(&mghdr-»mgh lock, &mattr); 

93 pthread mutexattr destroy(&mattr); /* be sure to destroy */ 
94 if (i I2 0) 

95 goto pthreaderr; 

96 if ( (i = pthread condattr init(&cattr)) !- 0) 

97 goto pthreaderr; 

98 pthread condattr setpshared(&cattr, PTHREAD PROCESS SHARED); 
99 i = pthread cond init(&mqghdr-»mgh wait, &cattr); 

100 pthread condattr destroy(&cattr); /* be sure to destroy */ 
101 if (i l= 0) 

102 goto pthreaderr; 

103 /* initialization complete, turn off user-execute bit */ 
104 if (fchmod(fd, mode) -- -1) 

105 goto err; 

106 close (fd); 

107 return((mgd t) mqinfo) ; 

108 ) 


my pxmsg mmap/mq open.c 


图 5-22 (48) 
设置 文件 大 小 
51—58 ”计算 每 个 消息 的 大 小 ， 并 同上 舍 入 到 下 一 个 长 整数 大 小 的 
倍数 。 计 算 文件 大 小 时 会 将 在 该 文件 开头 分 配 的 mq_hdr 结 构 和 在 每 个 消 


恩 开 头 分 配 的 msg_hdr 结 构 所 占 的 空间 包括 在 内 (图 5-19〉。 使 用 ]seek 
设置 新 创建 文件 的 大 小 ， 然 后 往 当 前 读 写 位 置 写 入 字 节 0。 

只 调用 ftruncate (13.377) 会 更 容易 些 ， 但 是 我 们 不 能 保证 它 可 用 
来 增长 一 个 文件 的 大 小 。 

内 存 上 映射 该 文件 

59~63 使 用 mmap 内 存 映 射 该 文件 。 

分 配 mq_info 结 构 

64—66 ”我 们 给 mq_open 的 每 次 调用 分 配 一 个 mq_info 结 构 。 然 后 初 
始 化 该 结构 。 

初始 化 mq_hdr 结 构 

67~68 初始 化 mq_hdr 结 构 。 设 置 消 息 链 表 的 涉 (mqh_head) X0, 
把 队列 中 所 有 消息 加 到 空闲 链表 (mgh_free) 中 。 

初始 化 互 斥 锁 和 条 件 变 量 

88~102 “既然 只 要 知道 一 个 Posix 消 息 队 列 的 名 字 并 具有 足够 的 权 
限 ， 任 何 进程 都 能 共享 它 ， 那 么 我 们 必须 以 
PTHEAD_PROCESS_SHARED 属 性 初始 化 互 斥 锁 和 条 件 变量 。 为 此 我 
们 首先 调用 pthread_mutexattr_init 初 始 化 一 个 互 斥 锁 属 性 结构 ， 再 调用 
pthread_mutexattr_setpshared 在 该 结构 中 设置 进程 间 共 享 属性 ， 然 后 调用 
pthread_mnutex_init 初 始 化 互 斥 锁 。 对 于 条 件 变 量 也 完成 几乎 同样 的 步 
又 。 我 们 要 小 心地 摧毁 初始 化 了 的 互 斥 锁 属 性 或 条 件 变量 属性 ， 即 使 发 
生 错 误 也 这 样 ， 因 为 调用 pthread_mnutexattr_init 或 pthread_condattr_init 可 
能 分 配 了 内 存 空 间 (习题 7.3) 。 
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继续 打开 着 〈 这 样 会 占用 一 个 描述 符 ) 。 




















图 5-23 给 出 了 mdq_open 函 数 的 最 后 一 部 分 ， 它 打开 一 个 已 存在 的 队 
列 。 

打开 已 存在 的 消息 队列 

109—115 ”我 们 是 在 O_CREAT 标 志 未 指定 或 O_CREAT 指 定 了 但 消 
息 队 列 已 存在 的 条 件 下 到 达 这 里 的 。 这 两 种 情况 下 ， 我 们 将 打开 一 个 已 
存在 的 消息 队列 。 我 们 open 含 有 该 消息 队列 的 文件 来 读 写 ， 并 使 用 
mmap 把 该 文件 内 存 映射 到 当前 进程 的 地 址 空间 中 。 

就 打开 模式 而 言 ， 我 们 的 实现 简化 了 。 即 使 调用 者 指定 了 
O_RDONLY， 我 们 也 必须 给 open 和 mmap 指 定 读 写 访问 ， 因 为 不 可 能 从 
一 个 队列 中 读 出 一 个 消息 而 不 改变 该 队列 所 在 的 内 存 映 射 文件 。 同 样 
地 ， 我 们 不 可 能 往 一 个 队列 中 写 入 一 个 消息 而 不 读 其 内 存 映射 文件 。 解 
决 这 个 问题 的 方法 之 一 是 在 mq_info 结 构 中 保存 打开 模式 
(O_RDONLY、O_WRONLY 或 O_RDWR) ， 然 后 在 各 个 函数 中 检查 
这 个 模式 。 人 例如， 如果 打开 模式 是 DO _WRONLY，mq_receive 就 应 该 失 
败 。 

验证 消息 队列 已 初始 化 

116—132 ”我 们 必须 等 待 消息 队列 的 初始 化 (以 防 多 个 线程 几乎 同 
时 尝试 创建 同一 个 消息 队列 ) 。 为 此 我 们 调用 stat 查 看 内 存 映 射 文件 的 
权限 (stat 结 构 的 st_mode 成 员 ) 。 如 果 用 户 执行 位 已 关 掉 ， 那 么 消息 队 
列 已 被 初始 化 。 

这 段 代 码 还 处 理 另外 一 个 可 能 的 竞争 状态 。 假 设 不 同 进程 中 的 两 个 
线程 几乎 同时 打开 同一 个 消息 队列 。 第 一 个 线程 创建 了 由 调用 者 给 定 的 
文件 后 阻塞 在 图 5-22 中 的 lseek 调 用 中 。 第 二 个 线程 发 现 该 文件 已 存在 ， 
于 是 跳 转 到 exists 标 号 处 ， 在 那儿 它 再 次 打开 文件 ， 然 后 阻塞 。 第 一 个 
线程 再 次 运行 ， 然 而 它 在 图 5-22 中 的 mmap 调 用 失败 (也 许 是 因为 它 超 
过 了 自己 的 虚拟 内 存 限制 ) ， 于 是 跳 转 到 err 标 号 处 unlink 自 己 创建 的 文 
件 。 第 二 个 线程 继续 运行 ， 该 线 











程 就 可 能 在 等 待 该 文件 初始 化 的 for 循 环 中 超时 。 于 是 我 们 改 为 调用 
stat， 而 且 如 果 它 返回 一 个 文件 不 存在 的 错误 ， 同 时 O_CREAT 标 志 已 指 
定 ， 那 么 我 们 跳 转 到 again 标号 处 〈 图 5-21) 以 再 次 创建 该 文件 。 这 种 可 
能 的 竞争 状态 也 是 我 们 在 open 调 用 中 检查 ENOENT 错 误 的 原因 。 


my pxmsg mmap/mq open.c 
109 exists: 


110 /* open the file then memory map */ 

1X1 if ( (fd = open(pathname, O RDWR)) < 0) { 
112 if (errno -- ENOENT && (oflag & O CREAT)) 
113 goto again; 

114 goto err; 

115 ) 

116 /* make certain initialization is complete */ 
117 for (i = 0; i < MAX TRIES; i++) { 

118 if (stat(pathname, &statbuff) == -1) { 
119 if (errno == ENOENT && (oflag & O CREAT)) { 
120 close (fd); 

121 goto again; 

122 ) 

123 goto err; 

124 } 

125 if ((statbuff.st mode & S IXUSR) == 0) 
126 break; 

127 sleep(1); 

128 ) 

129 if (i == MAX TRIES) { 

130 errno - ETIMEDOUT; 

IRL goto err; 

132 } 

133 filesize = statbuff.st_size; 


134 mptr = mmap (NULL, filesize, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
135 if (mptr -- MAP FAILED) 

136 goto err; 

137 close(fd); 


138 /* allocate one mq info() for each open */ 
139 if ( (mginfo = malloc(sizeof (struct mq info))) == NULL) 
140 goto err; 


141 mginfo-»mgi hdr = (struct mq hdr *) mptr; 


142 mqinfo-»mgi magic = MQI MAGIC; 
143 mginfo-»mqi flags - nonblock; 
144 return((mgd t) mginfo); 

145 pthreaderr: 

146 errno - i; 

147 err: 

148 /* don't let following function calls change errno */ 
149 Save errno - errno; 

150 if (created) 

151 unlink (pathname) ; 

152 if (mptr != MAP FAILED) 

153 munmap (mptr, filesize); 
154 if (mginfo !- NULL) 

155 free (mginfo); 

156 close(fd); 

157 errno - save errno; 

158 return((mgd t) -1); 

159 } 


my pxmsg mmap/mq open.c 


图 5-23 mq openPAZI S — i4: 打开 已 存在 的 队列 


内 存 上 映射 文件 ， 分 配 并 初始 化 mq_info 结 构 

133 一 144 内 存 映射 消息 队列 所 在 文件 ， 然 后 关闭 该 文件 的 描述 
从。 分 配 一 个 mq_info 结 构 并 将 其 初始 化 。 返 回 值 为 指向 这 个 新 分 配 
mq_info 结 构 的 指针 。 

处 理 错 误 

145—158 ” 当 在 本 函数 中 此 前 某 处 检测 到 一 个 错误 时 ， 程 序 将 跳 转 
到 err 标 号 处 ， 同 时 ermo 已 被 设置 成 将 由 mq_open 返 回 的 值 。 这 里 我 们 要 
注意 保证 检测 到 错误 后 调用 的 用 于 清理 的 函数 不 影响 将 由 本 函数 返回 的 
errno 值 。 

5.8.2 mq closer Zi 

图 5-24 给 出 了 我 们 的 mq_close 函 数 。 


my_pxmsg_mmap/mq_close.c 


1 #include "unpipc.h" 
2 #include "mqueue.h" 
3 int 


4 mq close (mdqd t mqd) 


6 long msgsize, filesize; 
7 struct mq hdr *mghdr; 
8 struct mq attr  *attr; 
9 struct mq info *mqinfo; 
10 mqinfo = mqd; 
13 if (mqinfo->mqi magic !- MQI MAGIC) { 
12 errno - EBADF; 
13 return (-1); 
14 } 
15 mghdr = mginfo->mqi_hdr; 
16 attr = &mghdr->mgh_attr; 
197 if (mq notify (mgd, NULL) != 0) /* unregister calling process */ 
18 return(-1); 
19 msgsize - MSGSIZE(attr-»mq msgsize); 
20 filesize = sizeof(struct mq hdr) + (attr-»mq maxmsg * 
21 (sizeof(struct msg hdr) + msgsize)); 
22 if (munmap(mginfo-»mqgi hdr, filesize) == -1) 
23 return(-1); 
24 mqinfo->mqi magic = 0; /* just in case */ 
25 free (mginfo); 
26 return(0); 
27 } 





my pxmsg mmap/mq close.c 


[5-24 mq closer Xi 

取得 指向 各 个 结构 的 指针 

10—16 验证 参数 的 有 效 性 后 ， 取 得 指向 内 存 映 射 区 Gnghdr). 和 属 
性 (在 mq_hdr 结 构 中 〉 的 指针 。 

注销 调用 进程 

17~18 ”调用 mq_notify 注 销 队 列 的 调用 进程 。 如 果 该 进程 已 注册 ， 
它 就 被 注销 ， 但 是 如 果 它 未 注册 过 ， 那 也 不 返回 错误 。 

撤销 内 存 区 映射 ， 释 放 内 存 空间 

19~25 给 munmap 计 算 待 撤销 内 存 映射 文件 的 大 小 ， 释 放 mq_info 结 
构 所 用 的 内 存 空间 。 为 防止 本 函数 的 调用 者 在 该 内 存 区 被 malloc 重 用 之 
前 继续 使 用 已 关闭 的 消息 队列 描述 符 ， 我 们 把 魔 数 设置 为 0， 这 样 我 们 
的 消息 队列 函数 以 后 将 检测 到 该 错误 。 





注意 ， 如 果 进 程 没 有 调用 mq_close 就 终止 ， 那 么 进程 终止 时 发 生 同 
样 的 操作 : 内 存 映射 文件 被 撤销 映射 ， 内 存 空 间 被 释放 。 

5.8.3 mq_unlink P4 ži 

图 5-25 给 出 了 我 们 的 mq_unlink 函 数 ， 它 会 删除 与 我 们 定义 的 某 个 消 
恩 队 列 相关 联 的 名 字 。 它 只 是 调用 Unix unlink K. 








my pxmsg mmap/mq unlink.c 
1 #include "unpipc.h" 
2 #include "mqueue.h" 


3 dnt 

4 mq unlink(const char *pathname) 

5 { 

if (unlink(pathname) == -1) 
return (-1); 

return (0) ; 


to moO 


my pxmsg mmap/mq unlink.c 





图 5-25 mq unlinkrA Zi 
5.8.4 mq_getattr K Zi 
图 5-26 给 出 了 我 们 的 mq_getattr 函 数 ， 它 返回 调用 者 指定 的 队列 的 当 
前 属性 。 





my_pxmsg_mmap/mq_getattr.c 


1 #include "unpipc.h" 
2 #include "mqueue.h" 
3 int 


4 mq getattr(mgd t mqd, struct mq attr *mqstat) 


6 int n; 

7 struct mq hdr *mqhdr; 

8 struct mq attr  *attr; 

9 struct mq info  *mginfo; 

10 mginfo = mqd; 

Ha if (mginfo-»mqi magic !- MQI MAGIC) { 

12 errno - EBADF; 

13 return(-1); 

14 ) 

15 mghdr = mginfo-»mgi hdr; 

16 attr = &mghdr-»mgh attr; 

17 if ( (n = pthread mutex lock(&mghdr-»mqh lock)) != 0) { 
18 errno - n; 

19 return(-1); 

20 ) 

21 mqstat-»mq flags = mginfo-»mgi flags;  /* per-open */ 
22 mqstat-»mq maxmsg = attr-»mq maxmsg; /* remaining three per-queue */ 
23 mqstat-»mq msgsize = attr-»mq msgsize; 

24 mqstat-»mq curmsgs - attr-»mq curmsgs; 

25 pthread mutex unlock(&mqghdr-»mgh lock); 

26 return(0); 


my pxmsg mmap/mq getattr.c 





锁 ， 


图 5-26 mdq_getattr 函 数 


获取 队列 的 互 斥 锁 

17~20 ”在 取得 属性 前 ， 必 须 获 取 由 调用 者 指定 的 消息 队列 的 互 斥 
以 免 另 外 某 个 线程 中 途 修 改 它 们 。 

5.8.5 mq_setattr PK ži 

图 5-27 给 出 了 我 们 的 mq_setattr 函 数 ， 它 给 调用 者 指定 的 队列 设置 当 








my_pxmsg_mmap/mq_setattr.c 





1 #include "unpipc.h" 
2 #include "mqueue.h" 
3. int 


4 mq setattr(mgd t mqd, const struct mq attr *mgstat, 


5 struct mq attr *omgstat) 

6 { 

7 int n; 

8 struct mq_hdr *mghdr ; 

9 struct mq attr  *attr; 

10 struct mq info *mqinfo; 

11 mqinfo = mqd; 

12 if (mginfo-»mqi magic != MQI MAGIC) { 

l3 errno - EBADF; 

14 return(-1); 

15 ) 

16 mqhdr = mginfo-»mgi hdr; 

17 attr - &mghdr-»mgh attr; 

18 if ( (n = pthread mutex lock(&mghdr-»mqh lock)) != 0) { 
19 errno = n; 

20 return (-1); 

21 } 

22 if (omqstat != NULL) { 

23 omqstat-»mq flags = mginfo-»mgi flags; /* previous attributes */ 
24 omgstat->mq_maxmsg = attr-»mq maxmsg; 

25 omqstat-»mq msgsize = attr-»mq msgsize; 

26 omqstat-»mq curmsgs - attr-»mq curmsgs; /* and current status */ 
27 ) 

28 if (mqstat-»mq flags & O NONBLOCK) 

29 mqinfo-»mqi flags |- O NONBLOCK; 

30 else 

31 mginfo-»mgi flags &- -O NONBLOCK; 

32 pthread mutex unlock (&mqhdr-»mgh lock); 

33 return(0); 

34 ) 





my pxmsg mmap/mq setattr.c 


[55-27 mq setattriK 2X 

返回 当前 属性 

22—27 ”如 采 第 三 个 参数 是 一 个 非 空 指针 ， 那 就 在 修改 属性 前 返回 
先前 的 属性 和 当前 的 状态 。 

修改 mq_flags 

28 一 31 可 使 用 本 函数 修改 的 唯一 属性 是 mq_flags， 我 们 将 它 放 置 在 
mq_info 结 构 中 。 

5.8.6 mq notify rA Zi 

图 5-28 给 出 的 mq_notify 函 数 注册 或 注销 所 指定 队列 的 调用 进程 。 我 





们 追踪 当前 已 注册 为 接收 出 自 某 个 队列 的 通知 的 进程 ， 办 法 是 将 它 的 进 
程 ID 存放 在 对 应 该 队列 的 mq_hdr 结 构 的 mqh_pid 成 员 中 。 对 于 一 个 给 定 
队列 ， 每 次 只 有 一 个 进程 可 注册 。 当 一 个 进程 注册 自身 时 ， 它 还 把 通过 
函数 参数 指定 的 sigevent 结 构 保 存 到 mqh_event 结 构 中 。 





my pxmsg mmap/mq notify.c 


1 #include "unpipc.h" 

2 #include "mqueue.h" 

3 int 

4 mq notify(mqd t mgd, const struct sigevent *notification) 

5 { 

6 int n; 

7 pid t pid; 

8 struct mq hdr  *mghdr; 

9 struct mq info  *mginfo; 

10 mginfo = mqd; 

11 if (mginfo-»mqi magic !- MQI MAGIC) { 

12 errno = EBADF; 

13 return (-1) ; 

14 } 

l5 mqhdr = mqinfo->mqi_hdr; 

16 if ( (n = pthread_mutex_lock(&mqhdr->mgh_lock)) != 0) { 
17 errno - n; 

18 return(-1); 

19 ) 

20 pid = getpid(); 

21 if (notification -- NULL) ( 

22 if (mghdr-»mgh pid == pid) { 

23 mghdr->mgh_pid = 0; /* unregister calling process */ 
24 ) /* no error if caller not registered */ 
25 ) eise ( 

26 if (mghdr-»mgh pid !- 0) ( 

27 if (kill(mghdr-»mgh pid, O) !- -1 || errno !- ESRCH) ( 
28 errno - EBUSY; 

29 goto err; 

30 } 

31 } 

32 mghdr-»mgh pid = pid; 

33 mqhdr->mqh event = *notification; 

34 } 

35 pthread mutex unlock(&mghdr-»mqgh lock); 

36 return(0); 

37 err: 

38 pthread mutex unlock (&mqhdr-»mgh lock); 

39 return(-1); 

40 } 





my pxmsg mmap/mq notify.c 


15-28 mq. notify FK 2 
注销 调用 进程 
20—24 ”如 果 第 二 个 参数 是 个 空 指针 ， 那 么 注销 所 指定 队列 的 调用 
进程 。 可 能 让 人 奇怪 的 是 ， 调 用 进程 未 曾 被 注册 接收 该 队列 的 通知 并 未 
被 指定 为 一 种 错误 。 
注册 调用 进程 


25—34 如 果 某 个 进程 已 被 注册 ， 我 们 就 通过 回 它 发 送信 号 0〈 称 为 
空 信号 (null signal) ) 以 检查 它 是 否 仍然 存在 。 这 么 做 只 是 执行 普通 的 
出 错 检查 ， 而 不 发 送 任何 信号 ， 会 在 该 进程 不 存在 时 返回 一 个 ESRCH 
错误 。 如 果 先 前 注册 了 的 进程 仍然 存在 ， 本 函数 就 返回 一 个 EBUSY 错 
误 。 人 否则 ， 保 存 调 用 进程 的 进程 ID 以 及 调用 者 的 sigevent 结 构 。 

这 里 测试 先前 注册 了 的 进程 是 否 存在 的 方法 是 不 完善 的 。 该 进程 可 
能 终止 ， 而 其 进程 ID 却 在 以 后 某 个 时 刻 被 重用 。 

5.8.7 mq_send 函 数 

图 5-29 给 出 了 我 们 的 mq_send 函 数 的 前 半 部 分 。 











my_pxmsg_mmap/mq_send.c 


1 #include "unpipc.h" 

2 include "mqueue.h" 

3 int 

4 mq send(mqd t mqd, const char *ptr, size t len, unsigned int prio) 
5 { 

6 int n; 

7 long index, freeindex; 

8 int8 t *mptr; 

9 struct sigevent *sigev; 

10 struct mq hdr *mghdr; 
11 struct mq attr *attr; 
12 struct msg hdr *msghdr, *nmsghdr, *pmsghdr; 

13 struct mq info *mginfo; 
14 mginfo = mqd; 
15 if (mginfo-»mqi magic !- MOI MAGIC) { 
16 errno = EBADF; 
17 return (-1) ; 
18 } 
19 mqhdr = mginfo-»mgi hdr; /* struct pointer */ 
20 mptr - (int8 t *) mghdr; /* byte pointer */ 
21 attr = &mghdr-»mgh attr; 
22 if ( (n = pthread mutex lock(&mghdr-»mgh lock)) != 0) { 
23 errno - n; 
24 return(-1); 
25 ) 
26 if (len > attr-»mq msgsize) { 
27 errno - EMSGSIZE; 
28 goto err; 
29 ) 

30 if (attr-»mq curmsgs -- 0) ( 

31 if (mghdr-»mgh pid != 0 && mghdr-»mgh nwait == 0) { 
32 sigev - &mghdr-»mgh event; 

33 if (sigev-»sigev notify -- SIGEV SIGNAL) ( 

34 sigqueue (mqhdr->mqh pid, sigev-»sigev signo, 
35 sigev-»sigev value); 

36 

37 mqghdr-»mgh pid = 0; /* unregister */ 

38 ) 

39 ) else if (attr-»mq curmsgs »- attr-»mq maxmsg) ( 
40 /* queue is full */ 
41 if (mqinfo-»mqi flags & O NONBLOCK) { 
42 errno - EAGAIN; 
43 goto err; 
44 } 
45 /* wait for room for one message on the queue */ 
46 while (attr-»mq curmsgs >= attr->mq_maxmsg) 
47 pthread cond wait(&mghdr-»mqh wait, &mghdr-»mgh lock); 
48 } 


my_pxmsg_mmap/mq_send.c 





图 5-29 mq_send 函 数 : 前 半 部 分 
初始 化 
14~29 ”取得 指 同 我 们 将 使 用 的 各 个 结构 的 指针 ， 获 取 访 问 调 用 者 
指定 队列 的 互 斥 锁 。 检 查 符 发 送 消 县 ， 确 定 其 大 小 没有 超过 该 队列 的 最 
大 消息 大 小 。 





检查 队列 是 否 为 空 ， 若 合适 则 发 送 通 知 

30—38 ”如 果 是 在 往 一 个 空 队列 中 放置 消息 ， 我 们 就 检查 是 否 有 某 
个 进程 被 注册 为 接收 出 自 该 队列 的 通知 ， 并 检查 是 否 有 某 个 线程 阻塞 在 
mq_receive 调 用 中 。 对 于 后 面 那 种 检查 而 言 ， 我 们 将 看 到 图 5-31 和 图 5- 
32 中 的 mq_receive 函 数 维 护 着 一 个 用 来 存放 阻塞 在 空 队列 上 的 线程 数 的 
计数 器 Cmgh_nwait) 。 如 果 该 计数 器 的 值 为 非 零 ， 我 们 就 不 同 已 注册 
了 的 进程 发 送 任何 通知 。 我 们 只 处 理 SIGEV_SIGNAL 这 种 通知 方式 ， 其 
信号 通过 调用 sigqueue 发 出 。 已 注册 了 的 进程 随后 被 注销 。 

调用 sigqueue 发 送信 号 导致 回信 号 处 理 程序 传递 的 siginfo_t 结 构 
(5.747) 中 si_code 成 员 的 值 为 SLQUEUE， 这 是 不 正确 的 ， 正 确 的 值 应 
为 SL_ MESGQ。 从 用 户 进程 中 产生 正确 的 si_code 取 决 于 实现 。 [IEEE 
1996」 第 433 页 提 到 ， 要 从 一 个 用 户 函 数 库 中 产生 该 信 写 ， 需 用 到 进入 
言 写 产生 机 制 的 一 个 隐藏 接口 。 

检查 队列 是 否 填 满 

39—48 如 果 调 用 者 指定 的 队列 已 填 满 ， 但 是 O_NONBLOCK 标 志 已 
设置 ， 我 们 就 返回 一 个 EAGAIN 错 误 。 和 否则， 我 们 等 竺 在 条 件 变 量 
mdqh_wait 上 ， 该 条 件 变量 由 我 们 的 mdq_receive 函 数 在 从 某 个 填 满 的 队列 
中 读 出 一 个 消息 时 发 给 信号 。 

就 mq_send 调 用 在 被 某 个 由 其 调用 进程 捕获 的 信号 中 断 时 返回 一 个 
EINTR 错 误 而 言 ， 我 们 的 实现 简化 了 。 问 题 在 于 当 信 号 处 理 程序 返回 
时 ，pthread_cond_wait 并 不 返回 一 个 错误 : 它 可 能 返回 一 个 为 0 的 值 ( 这 
看 来 是 次 虚假 的 唤醒 ) ， 也 可 能 根本 不 返回 。 绕 过 这 一 问题 的 方法 确实 
存在 ， 但 每 种 方法 都 不 简单 。 

图 5-30 给 出 了 mq_send 函 数 的 后 半 部 分 。 至 此 我 们 已 知道 调用 者 指 
定 的 队列 中 有 写 入 新 消息 的 空间 。 

取得 竺 用 空闲 块 的 索引 

50~52 “既然 在 调用 者 指定 的 队列 初始 化 时 创建 的 空闲 消息 数 等 于 






































mdq_maxmsg， 我 们 就 不 应 该 有 在 空闲 链表 为 空 的 前 提 下 mq_curmsgs 小 
于 mq_maxmsg 的 状态 。 

A fl TES E 

53~56 nmsghdr 含 有 所 映射 内 存 区 中 用 于 存放 待 写 入 消息 的 位 置 的 
地 址 。 该 消息 的 优先 级 和 长 度 存 放 在 它 的 msg_hdr 结 构 中 ， 其 内 容 则 从 
调用 者 空间 复制 。 

把 新 消息 置 于 链表 中 正确 位 置 

57—74 我们 的 链表 中 各 消息 的 顺序 是 从 开始 处 Gmgh_head) 的 最 
高 优先 级 到 结束 处 的 最 低 优先 级 。 当 一 个 新 消息 加 入 调用 者 指定 的 队列 
中 ， 并 且 一 个 或 多 个 同样 优先 级 的 消息 已 在 该 队列 中 时 ， 这 个 新 消 上 息 就 
加 在 最 后 一 个 优先 级 相同 的 消息 之 后 。 使 用 这 样 的 排序 方式 后 ， 
mq_receive 总 是 返回 链表 中 的 第 一 个 消 奶 〈《 它 是 该 队列 上 优先 级 最 高 的 
最 早 的 消息 ) 。 当 我 们 沿 链表 行进 时 ，pmsghdr 将 含有 链表 中 上 一 个 消 
晨 的 地 址 ， 因 为 它 的 msg_next 值 将 含有 该 新 消息 的 索引 。 

我 们 的 做 法 在 该 队列 中 有 大 量 消息 时 可 能 较 慢 ， 因 为 每 次 往 该 队列 
中 写 入 一 个 消息 时 都 得 过 历 大 量 的 链表 项 。 可 以 再 维护 一 个 索引 ， 让 它 
记 住 各 个 可 能 优先 级 的 最 后 一 个 消息 的 位 置 。 























my pxmsg mmap/mq send.c 





49 /* nmsghdr will point to new message */ 

50 if ( (freeindex = mghdr-»mgh free) == 0) 

Ei err dump("mq send: curmsgs - $1d; free - 0", attr-»mq curmsgs); 
52 nmsghdr = (struct msg hdr *) &mptr[freeindex]; 

53 nmsghdr->msg_prio = prio; 

54 nmsghdr->msg_len = len; 

55 memcpy (nmsghdr + 1, ptr, len); /* copy message from caller */ 
56 mghdr-»mgh free = nmsghdr->msg_next; /* new freelist head */ 
57 /* find right place for message in linked list */ 

58 index = mqhdr->mqh_head; 

59 pmsghdr = (struct msg hdr *) &(mqhdr->mqh_head) ; 

60 while (index != 0) { 

61 msghdr = (struct msg_hdr *) &mptr [index] ; 

62 if (prio > msghdr->msg_prio) { 

63 nmsghdr-»msg next = index; 

64 pmsghdr-»msg next = freeindex; 

65 break; 

66 } 

67 index = msghdr->msg_next; 

68 pmsghdr = msghdr; 

69 } 

70 if (index == 0) { 

71 /* queue was empty or new goes at end of list */ 

72 pmsghdr-»msg next = freeindex; 

7 nmsghdr->msg_next = 0; 

74 } 

75 /* wake up anyone blocked in mq receive waiting for a message */ 
76 if (attr->mq_curmsgs == 0) 

TT pthread cond signal(&mghdr-»mgh wait); 

78 attr->mq_curmsgs++; 

79 pthread_mutex_unlock (&mghdr->mgh_lock) ; 

80 return (0) ; 

8T err: 

82 pthread mutex unlock(&mqghdr-»mgh lock); 

83 return(-1); 

84 } 


my pxmsg mmap/mq send.c 





图 5-30 mq send Zi: 后 半 部 分 


唤醒 阻塞 在 mq_receive 中 的 任何 线程 

75 一 77 如 果 在 往 该 队列 放置 新 消息 前 该 队列 为 空 ， 我 们 就 调用 
pthread_cond_signal 唤 醒 可 能 阻塞 在 mq_receive 中 的 任何 线程 。 

78 给 当前 在 该 队列 中 的 消息 数 mq_curmsgs 加 1。 

5.8.8 mq_receive rs Zi 

图 5-31 给 出 了 我 们 的 mq_receive 函 数 的 前 半 部 分 ， 它 设置 所 需 的 指 
针 、 获 取 互 斥 锁 ， 并 验证 调用 者 的 缓冲 区 足以 容纳 最 大 的 可 能 消 乱 。 


检查 队列 是 否 为 空 

30~40 如 果 由 调用 者 指定 的 队列 为 空 ， 而 且 O_NONBLOCK 标 志 已 
设置 ， 那 就 返回 一 个 EAGAIN 错 误 。 否 则 ， 给 该 队列 的 mqh_nwait 计 数 
器 加 1， 它 由 图 5-29 中 的 mq_send 函 数 检 查 ， 检 碍 前 提 是 该 队列 为 空 ， 而 
且 某 个 进程 已 注册 成 接收 该 队列 的 通知 。 然 后 等 待 在 条 件 变量 上 ， 它 由 
图 5-29 中 的 mq_send 发 送信 号 。 





my pxmsg mmap/mq receive.c 





1 #include "unpipc.h" 

2 #include "mqueue .h" 

3 ssize t 

4 mq receive(mgd t mgd, char *ptr, size t maxlen, unsigned int *priop) 
5: { 

6 int n; 

7 long index; 

8 ints t *mptr; 

9 ssize t len; 

10 struct mq hdr *mqhdr ; 

11 struct mq attr  *attr; 

12 struct msg hdr  *msghdr; 

13 struct mq info  *mginfo; 

14 mqinfo = mqd; 

15 if (mginfo-»mqi magic != MOI MAGIC) { 

16 errno - EBADF; 

17 return(-1); 

18 ) 

19 mghdr = mginfo-»mgi hdr; /* struct pointer */ 

20 mptr = (int8 t *) mghdr; /* byte pointer */ 

21 attr = &mghdr-»mgh attr; 

22 if ( (n = pthread mutex lock(&mqhdr-»mqh lock)) != 0) { 
23 errno - n; 

24 return(-1); 

25 ) 

26 if (maxlen « attr-»mq msgsize) ( 

2 errno - EMSGSIZE; 

28 goto err; 

29 ) 

30 if (attr-»mq curmsgs == 0) { /* queue is empty */ 
31 if (mginfo-»mqi flags & O NONBLOCK) { 

32 errno - EAGAIN; 

33 goto err; 

34 ) 

35 /* wait for a message to be placed onto queue */ 
36 mghdr-»mgh nwait++; 

37 while (attr-»mq curmsgs -- 0) 

38 pthread cond wait(&mqghdr-»mqh wait, &mqghdr-»mgh lock); 
39 mqhdr-»mgh nwait--; 

40 } 


my pxmsg mmap/mq receive.c 





图 5-31 mq receiver 2X: 前 半 部 分 


跟 mq_send 的 实现 一 样 ， 就 mq_receive 调 用 在 被 某 个 由 其 调用 进程 
捕获 的 信号 中 断 时 返回 一 个 EINTR 错 误 而 言 ， 我 们 的 实现 简化 了 。 

图 5-32 给 出 了 我 们 的 mq_receive 函 数 的 后 半 部 分 。 至 此 我 们 已 知道 
由 调用 者 指定 的 队列 中 有 一 个 消息 准备 返回 给 调用 者 。 

给 调用 者 返回 消息 





43~51 msghdr 指 同调 用 者 指定 队列 中 第 一 个 消息 的 msg_hdr， 它 是 
我 们 要 返回 的 。 由 该 消息 占据 的 空间 变 为 空闲 链表 的 新 头 。 

唤醒 阻塞 在 mgq_send 中 的 任何 线程 

52—54 “如 采 该 队列 在 我 们 从 中 取 走 竺 读 出 消息 前 是 填 满 的 ， 我 们 
了 驶 调用 pthread_cond_signal， 以 防 某 个 线程 阻塞 在 mq_send 调 用 中 等 竺 一 
^38 AY 22 [ad e 


my_pxmsg_mmap/mq_receive.c 





41 if ( (index = mghdr->mgh head) == 0) 

42 err dump("mq receive: curmsgs = %ld; head = 0", attr->mq_curmsgs) ; 
43 msghdr = (struct msg_hdr *) &mptr [index] ; 

44 mqhdr->mqh_head = msghdr-»msg next; /* new head of list */ 
45 len = msghdr->msg_len; 

46 memcpy (ptr, msghdr + 1, len); /* copy the message itself */ 
47 if (priop != NULL) 

48 *priop = msghdr->msg_prio; 

49 /* just-read message goes to front of free list */ 

50 msghdr-»msg next = mghdr-»mgh free; 

51 mghdr-»mgh free = index; 

52 /* wake up anyone blocked in mq send waiting for room */ 
53 if (attr-»mq curmsgs -- attr-»mq maxmsg) 

54 pthread cond signal (&mqhdr->mqh wait); 

55 attr-»mq curmsgs--; 

56 pthread mutex unlock(&mqhdr-»mgh lock); 

57 return(len); 

58 err: 

59 pthread mutex unlock(&mqghdr-»mgh lock); 

60 return(-1); 

61 ) 


my pxmsg mmap/mq receive.c 








图 5-32 mq receiver& Zt: 后 半 部 分 
5.9 小 结 


Posix 消 息 队 列 比较 简单 : mq_open 创 建 一 个 新 队列 或 打开 一 个 已 存 
在 的 队列 ，mq_close 关 闭 队列 ，mq_unlink 则 删除 队列 名 。 往 一 个 队列 中 
放置 消息 使 用 mq_send， 从 一 个 队列 中 读 出 消息 使 用 mq_receive。 队 列 
属性 的 查询 与 设置 使 用 mq_getattr 和 mq_setattr， 消 数 mq_notify 则 允许 我 
们 注册 一 个 信号 或 线程 ， 它 们 在 有 一 个 消息 被 放置 到 某 个 空 队 列 上 时 发 








i CaS) 或 激活 (线程 》。 队 列 中 的 每 个 消息 被 赋予 一 个 小 整数 优先 

级 ，mq_receive 每 次 被 调用 时 总 是 返回 最 高 优先 级 的 最 早 消 息 。 
mq_notify 的 使 用 给 我 们 引入 了 Posix 实 时 信号 ， 它 们 在 SIGRTMIN 

和 SIGRTMAX 之 间 。 当 设置 SA_SIGINFO 标 志 来 安装 这 些 信号 的 处 理 程 

E, G) 这 些 信号 是 排队 的 ，(2) 排 了 队 的 信号 是 以 FIFO 顺 序 递交 

I, (3) 给 信号 处 理 程序 传递 两 个 额外 的 参数 。 

最 后 ， 我 们 使 用 内 存 上 映射 TO 以 及 一 个 Posix 互 斥 锁 和 一 个 Posix 条 件 
变量 ， 以 约 500 行 C 代 码 实 现 了 Posix 消 息 队 列 的 大 多 数 特 性 。 该 实现 展 
示 了 处 理 新 队列 的 创建 中 存在 的 一 个 竞争 状态 ， 我 们 在 第 10 章 中 实现 
Posix 信 号 量 时 将 遇 到 同样 的 竞争 状态 。 


习题 


5.1 在 介绍 图 5-5 时 我 们 说 过 ， 当 创建 新 队列 时 ， 如 果 mq_open 的 attr 
参数 非 空 ， 那 么 mq_maxmsg 和 mdq_msgsize 两 个 成 员 都 必须 指定 。 怎 么 做 
才能 允许 我 们 只 指定 其 中 的 一 个 成 员 ， 而 未 指定 的 那个 成 员 则 采用 系统 
的 默认 值 ? 

5.2 ”修改 图 5-9 中 的 程序 ， 使 得 所 讨论 的 信号 在 递交 之 时 并 不 调用 
mq_notify。 然 后 往 相 应 的 队列 发 送 两 个 消息 ， 验 证 对 应 第 二 个 消息 的 信 
号 没有 产生 。 为 什么 ? 

5.3 修改 图 5-9 中 的 程序 ， 使 得 所 讨论 的 信号 在 递交 之 时 并 不 从 相应 
队列 中 读 出 消息 。 相 反 ， 处 理 程序 只 是 调用 mq_notify 并 输出 接收 到 的 信 
号 。 然 后 往 该 队列 发 送 两 个 消息 ， 验 证 对 应 第 二 个 消息 的 信号 没有 产 
^E. AA? 

5.4 在 图 5-17 的 第 一 个 printt 中 ， 如 果 我 们 把 那 两 个 常 值 癌 整数 的 类 
型 强制 转换 去 掉 ， 那 么 会 发 生 什 么 情况 ? 

55 如 下 修改 图 5-5 中 的 程序 : 在 调用 mq_open 之 前 ， 输 出 一 个 消息 





并 sleep 30 秒 。 在 mdq_open 返 回 之 后 ， 输 出 另 一 个 消息 ，sleep 30 秒 ， 然 
后 调用 mq_close。 编 译 并 运行 该 程序 ， 指 定 一 个 较 大 的 消息 数 〔( 几 十 万 
个 ) ， 最 大 消息 大 小 则 〈( 壁 如 说 ) 为 10 字 节 。 其 目的 是 创建 一 个 大 消息 
队列 〈 数 百 万 字 节 大 小 ) ， 然 后 查看 消息 队列 的 实现 是 否 使 用 内 存 映 射 
文件 。 在 第 一 个 30 秒 停顿 期 间 ， 运 行 一 个 诸如 ps 这 样 的 程序 ， 看 一 看 修 
改 后 程序 的 内 存 大 小 。mq_open 返 回 后 再 做 一 遍 。 你 能 解释 所 发 生 的 情 
况 吗 ? 

5.6 当 mq_send 的 调用 者 指定 一 个 0 长 上 度 时 ， 图 5-30 中 的 memcpy 调 用 
会 发 生 什 么 ? 

5.7 此 较 消息 队列 和 4.4 节 讲述 的 全 双 工 管道 。 父 子 进程 之 间 的 双 癌 
通信 和 需 多 少 个 消息 队列 ? 

5.8 图 5-24 中 我 们 为 什么 不 摧毁 互 斥 锁 和 条 件 变 量 ? 

5.9 Posix 说 消息 队列 描述 符 不 能 是 数组 类 型 。 为 什么 ? 

5.10 网 5-14 中 的 main 函 数 在 哪儿 花费 大 部 分 时 间 ? 每 次 递交 一 个 信 
号 后 发 生 什 么 ? 我 们 如 何 处 理 这 种 情形 ? 

5.11 不 是 所 有 实现 都 文 持 互 斥 锁 和 条 件 变量 的 
PTHREAD_PROCESS_SHARED 属 性 。 重 新 编写 5.8 节 中 Posix 消 息 队 列 
的 实现 ， 使 用 Posix 信 号 量 〈 第 10 章 ) 代替 互 斥 锁 和 条 件 变 量 。 

5.12 把 5.8 节 中 Posix 消 息 队 列 的 实现 扩展 成 文 持 SIGEV_THREAD。 
































第 6 章 System VÄ JS BA 71] 


6.1 概述 


System V 消 息 队 列 使 用 消息 队列 标识 符 (message queue identifier) 
标识 。 有 具有 足够 特权 〈3.5 节 ) 的 任何 进程 都 可 以 往 一 个 给 定 队 列 放 置 
个 消息 ， 具 有 足够 特权 的 任何 进程 都 可 以 从 一 个 给 定 队 列 读 出 一 个 消 
A. BRPosixil E BA JJ — FE, ee m QUEM 
前 ， 不 求 另 外 某 个 进程 正在 等 待 该 队列 上 一 个 消息 的 到 达 
sn hs Bt — AE fe esyv/msg Jot 
件 中 的 信息 结构 。 


struct msqid ds { 











struct ipc_perm msg_perm; /* read_write perms: Section 3.3 */ 

struct msg *msg first; /* ptr to first message on queue */ 

struct msg *msg. last; /* ptr to last message on queue */ 

msglen t msg cbytes; /* current # bytes on queue */ 

msgqnum t msg qnum; /* current # of messages on 
queue */ 

msglen t msg qbytes; /* max # of bytes allowed on 
queue */ 

pid t msg lspid;  /* pid of last msgsnd()*/ 

pid t msg lrpid;  /* pid of last msgrcv()*/ 

time t msg stime;  /*time of last msgsnd()*/ 

time t msg rtime;  /* time of last msgrcv()*/ 


time t msg ctime;  /* time of last msgctl() 


(that changed the above)*/ 

H 

Unix “98 不 要 求 有 msg_first、msg_last 和 msg_cbytes 成 员 。 然 而 普通 
的 源 自 System V 的 实现 中 可 找到 这 三 个 成 员 。 很 自然 ， 将 一 个 队列 中 的 
各 个 消 忠 作为 一 个 链表 来 维护 的 要 求 并 不 存在 ， 但 这 却 是 msg_first 和 
msg_last 这 两 个 成 员 所 隐 含 的 。 就 算 提 供 了 这 两 个 指针 ， 那 么 它们 指 癌 
的 是 内 核 内 存 空间 ， 对 于 应 用 来 说 基本 上 没有 作用 。 

我 们 可 以 将 内 核 中 某 个 特定 的 消息 队列 画 为 一 个 消息 链表 ， 如 图 6- 
1 所 示 。 假 设 有 一 个 具有 三 个 消 恩 的 队列 ， 消 息 长 度 分 别 为 1 罕 节 、2 衬 
和 3 字 节 ， 而 且 这 些 消息 就 是 以 这 样 的 顺序 写 入 该 队列 的 。 再 假设 这 
三 个 消息 的 类 型 Ctype) 分 别 为 100、200 和 300。 
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消息 队 
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图 6-1 内 核 中 的 System V 消 息 队列 结构 
我 们 将 在 本 章 中 查看 操纵 System V 消 息 队 列 的 函数 ， 并 使 用 消息 队 
列 实现 4.2 节 中 的 文件 服务 器 例子 。 


6.2 msgget Phi Z 


msgget K BUA FB — “St B EAS BA 0) C; 8] — 1 ET AA 
列 。 


#include <sys/msg.h> 
int msgget(key_t key,int oflag); 
返回 : AMAR A, ee eV S-1 

返回 值 是 一 个 整数 标识 符 ， 其 他 三 个 msg 函 数 就 用 它 来 指 代 该 队 
列 。 它 是 基于 指定 的 key 产 生 的 ， 而 key 既 可 以 是 ftok 的 返回 值 ， 也 可 以 
是 常 值 IPC_PRIVATE， 如 图 3-3 所 示 。 

oflag 是 图 3-6 中 所 示 的 读 写 权限 值 的 组 合 。 它 还 可 以 与 IPC_CREAT 
或 IPC_CREATIIPC_EXCL 按 位 或 ， 如 随 图 3-4 的 讨论 所 述 。 

当 创建 一 个 新 消息 队列 时 ，msqid_ds 结 构 的 如 下 成 员 被 初始 化 。 

msg_perm 结 构 的 uid 和 cuid 成 员 被 设置 成 当前 进程 的 有 效用 户 ID， 
gid 和 cgid 成 员 被 设置 成 当前 进程 的 有 效 组 ID。 

oflag 中 的 读 写 权限 位 存放 在 msg_perm.mode 中 。 

msg_qnum、msg_lspid、msg_lrpid、msg_stime 和 msg_rtime 被 置 为 








msg_ctime 被 设置 成 当前 时 间 。 
msg_qbytes 被 设置 成 系统 限制 值 。 


6.3 msgsnd FÃ 2 
使 用 msgget 打 开 一 个 消息 队列 后 ， 我 们 使 用 msgsnd 往 其 上 放置 一 个 


#include <sys/msg.h> 
int msgsnd(int msqid,const void *ptr,size_t length,int flag); 
返回 : A MAO, a BEEN A-1 
其 中 msqid 是 由 msgget 返 回 的 标识 符 。ptr 古 一 个 结构 指针 ， 该 结构 
有 上 共有 如 下 的 模板 ， 它 定义 在 <sys/msg.h> 中 。 


struct msgbuf { 


long mtype; /* message type,must be > 0 */ 
char mtext[1]; /* message data */ 
h 
消息 类 型 必须 大 于 0， 因 为 对 于 msgrcv 函 数 来 说 ， 非 正 的 消息 类 型 
用 作 特 殊 的 指示 器 ， 我 们 将 在 下 一 东 讲 述 。 

msgbuf 结 构 定 义 中 的 名 字 mtext 不 大 确切 ， 消 息 的 数据 部 分 并 不 局 
限于 文本 。 任 何 形 式 的 数据 都 是 允许 的 ， 无 论 是 二 进 制 数 据 还 是 文本 。 
内 核 根本 不 解释 消息 数据 的 内 容 。 

我 们 使 用 “模板 ”的 说 法 描述 这 个 结构 ， 因 为 ptr 所 指 同 的 只 是 一 个 合 
有 消息 类 型 的 长 整数 ， 消 妃 本 身 则 紧 跟 在 它 之 后 〈 如 果 消 息 长 度 大 于 0 
字 节 ) 。 不 过 大 多 数 应 用 并 不 使 用 ms_gbuf 结 构 的 这 个 定义 ， 因 为 其 数 
据 量 (1 个 字 市 ) 通常 是 不 够 的 。 一 个 消 居中 的 数据 量 并 不 存在 编译 时 
限制 (其 系统 限制 则 通常 可 由 系统 管理 员 修 改 ) ， 因 此 可 不 去 声明 一 个 
数据 量 很 大 〈 比 一 个 给 定 应 用 可 能 支持 的 数据 还 要 大 ) 的 结构 ， 而 去 定 
义 一 个 上 述 的 模板 。 大 多 数 应 用 然后 定义 目 己 的 消息 结构 ， 其 数据 部 分 
根据 应 用 的 需要 定义 。 

举例 来 说 ， 如 果 系 个 应 用 需要 交换 由 一 个 16 位 整数 后 跟 一 个 8 字 市 
字符 数组 构成 的 消 轧 ， 那 它 可 以 定义 目 己 的 结构 如 下 : 

#define MY_DATA 8 

typedef struct my_msgbuf { 





long mtype; /* message type */ 
int16 t mshort: /* start of message data */ 
char mchar[MY DATA]; 

} Message; 








msgsnd 的 length 参 数 以 字 市 为 单位 指定 待 发 送 消 恩 的 长 度 。 这 是 位 
于 长 整数 消 恩 类 型 之 后 的 用 户 自 定义 数据 的 长 度 。 该 长 度 可 以 是 0。 在 
刚刚 给 出 的 例子 中 ， 长 度 可 以 传递 成 sizeof (Message)- sizeof(long)。 





flag 人 参数 既 可 以 是 0， 也 可 以 是 IPC_NOWAIT。IPC_NOWAIT 标 志 
使 得 msgsnd 调 用 非 阻塞 Cnonblocking) : 如 果 没 有 存放 新 消息 的 可 用 空 
间 ， 该 函数 就 马上 返回 。 这 个 条 件 可 能 发 生 的 情形 包括 : 

在 指定 的 队列 中 已 有 太 多 的 字 节 【对 应 该 队列 的 msqid_ds 结 构 中 的 
msg_qbytes{H) ; 

在 系统 范围 存在 太 多 的 消息 。 

如 果 这 两 个 条 件 中 有 一 个 存在 ， 而 且 IPC_NOWAIT 标 志 已 指定 ， 
msgsnd 就 返回 一 个 EAGAIN 错 误 。 如 果 这 两 个 条 件 中 有 一 个 存在 ， 但 是 
IPC_NOWAIT 标 志 未 指定 ， 那 么 调用 线程 被 投入 睡眠 ， 直 到 : 

具备 存放 新 消息 的 空间 ; 

由 msqid 标 识 的 消息 队列 从 系统 中 删除 〈 这 种 情况 下 返回 一 个 
EIDRM 错 误 ) ; 

调用 线程 被 某 个 捕获 的 信号 所 中 断 〈 这 种 情况 下 返回 一 个 EINTR 错 
WD. 








6.4 msgrcv r£ 25 
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#include <sys/msg.h> 
ssize t msgrcv(int msqid,void *ptr,size_t length,long type,int flag); 
返回 : 若 成 功 则 为 读 入 缓冲 区 中 数据 的 字 节 数 ， 
知 出 错 则 为 -1 

其 中 ptr 参 数 指 定 所 接收 消 奶 的 存放 位 置 。 跟 msgsnd 一 样 ， 该 指针 指 
问 紧 挨 在 真正 的 消 居 数 据 之 前 返回 的 长 整数 类 型 字段 (图 4-26) 。 

length 指 定 了 由 ptr 指 问 的 绥 冲 区 中 数据 部 分 的 大 小 。 这 是 该 函数 能 
返回 的 最 大 数据 量 。 该 长 度 不 包括 长 整数 类 型 字段 。 

type 指 定 硕 望 从 所 给 定 的 队列 中 读 出 什么 样 的 消 妃 。 








如 果 type 为 0， 那 吏 返 回 该 队列 中 的 第 一 个 消息 。 既 然 每 个 消息 队 
列 都 是 作为 一 个 FIFO“〈 先 进 先 出 ) 链表 维护 的 ， 因 此 type 为 0 指定 返回 
该 队列 中 最 早 的 消息 。 

如 果 type 大 于 0， 那 就 返回 其 类 型 值 为 type 的 第 一 个 消息 。 

如 果 type 小 于 0， 那 就 返回 其 类 型 值 小 于 或 等 于 type 参 数 的 绝对 值 的 
消息 中 类 型 值 最 小 的 第 一 个 消息 。 

考虑 图 6-1 中 所 示 的 消息 队列 例子 ， 它 含有 三 个 消息 : 

第 一 个 消息 的 类 型 为 100， E 

第 二 个 消息 的 类 型 为 200， 长 度 为 2; 

最 后 一 个 消息 的 类 型 为 300， 长 度 为 3。 

图 6-2 展 示 了 为 不 同 的 type 值 返回 的 消息 的 类 型 。 














所 返回 消息 的 类 型 





图 6-2 由 msgrcv 给 不 同 的 type 值 返回 的 消息 
msgrcv 的 flag 参 数 指定 所 请 求 类 型 的 消息 不 在 所 指定 的 队列 中 时 该 
做 何 处 理 。 在 没有 消息 可 得 的 情况 下 ， 如 果 设 置 了 flag 中 的 
IPC_NOWAIT 位 ，msgrcv 函 数 就 立即 返回 一 个 ENOMSG 错 误 。 和 否则， 
调用 者 被 阻塞 到 下 列 某 个 事件 发 生 为 止 : 
(1) 有 一 个 所 请 求 类 型 的 消息 可 获取 ; 














(2) 由 msqid 标 识 的 消息 队列 被 从 系统 中 删除 〈 这 种 情况 下 返回 一 个 
EIDRM 错 误 ) ; 

(3) 调 用 线程 被 某 个 捕获 的 信号 所 中 断 〈( 这 种 情况 下 返回 一 个 EINTR 
错误 ) 。 

flag 参 数 中 另 有 一 位 可 以 指定 : MSG_NOERROR。 当 所 接收 消息 的 
真正 数据 部 分 大 于 length 参 数 时 ， 如 果 设 置 了 该 位 ，msgrcv 函 数 就 只 是 
截 短 数据 部 分 ， 而 不 返回 错误 。 否 则 ，ms_grcv 返 回 一 个 E2BIG 错 误 。 

成 功 返 回 时 ，msgrcv 返 回 的 是 所 接收 消息 中 数据 的 字 节 数 。 它 不 包 
括 也 通过 ptr 参 数 返 回 的 长 整数 消息 类 型 所 需 的 几 个 字 节 。 


6.5 msgctl ij Zi 
msgctl 函 数 提供 在 一 个 消息 队列 上 的 各 种 控制 操作 。 


#include <sys/msg.h> 





int msgctl(int msqid,int cmd,struct msgid_ds *buff); 
返回 : ERIO, a tee A-1 

msgct 函 数 提供 3 个 命令 。 

IPC RMID 从 系统 中 删除 由 msqid 指 定 的 消息 队列 。 当 前 在 该 队列 
上 的 任何 消 明 都 被 丢弃 。 我 们 已 在 图 3-7 中 看 到 过 这 种 操作 的 例子 。 对 
于 该 命令 而 言 ，msgctl 函 数 的 第 三 个 参数 被 忽略 。 

IPC SET 给 所 指定 的 消息 队列 设置 其 msqid_ds 结 构 的 以 下 4 个 成 
员 : msg_perm.uid、msg_perm.gid、msg_perm.mode 和 msg_qbytes。 它 们 
的 值 来 自由 buff 参 数 指 癌 的 结构 中 的 相应 成 员 。 

IPC_STAT “〔 通 过 buff 参 数 ) 给 调用 者 返回 与 所 指定 消息 队列 对 应 
的 当前 msqid_ds 结 构 。 

例子 

图 6-3 中 的 程序 创建 一 个 消 恩 队列 ， 往 该 队列 中 放置 一 个 含有 1 字 市 


数据 的 消息 ， 发 出 msgctl 的 IPC_STAT 命 令 ， 使 用 System 函数 执行 ipcs 命 
令 ， 最 后 使 用 msgctl 的 IPC_RMID 命 令 删 除 该 队列 。 


svmsg/ctl.c 





1 include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 int msqid; 

6 struct msqid ds info; 

Fi struct msgbuf buf; 

8 msqid = Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 

9 buf.mtype - 1; 

10 buf.mtext[0] = 1; 

11 Msgsnd(msqid, &buf, 1, 0); 

12 Msgctl(msqgid, IPC STAT, &info); 

13 printf("read-write: %030, cbytes = $1u, qnum = $1u, qbytes = %lu\n", 
14 info.msg perm.mode & 0777, (ulong t) info.msg cbytes, 
15 (ulong t) info.msg gnum, (ulong t) info.msg_qbytes) ; 
16 system("ipcs -q"); 

17 Msgctl(msqid, IPC RMID, NULL); 

18 exit (0); 

T9: 


svmsg/ctl.c 





图 6-3 使 用 msgctl 命 令 的 例子 


我 们 把 1 字 节 长 度 的 消 恩 写 入 所 创建 的 队列 中 ， 这 里 只 要 使 用 定义 
在 <sys/msg.h> 中 的 标准 msgbuf 结 构 就 行 了 。 

执行 该 程序 的 结果 如 下 : 

solaris % ctl 

read-write: 664,cbytes = 1,qnum = 1,qbytes = 4096 

IPC status from <running system> as of Mon Oct 20 15:36:40 1997 

T ID KEY MODE 
OWNER GROUP 

Message Queues: 

q 1150 00000000 --rw-rw-r-- rstevens otherl 

这 与 预期 的 一 致 。 如 3.2 节 所 提 ，0 是 IPC_PRIVATE 键 的 共同 键 值 。 
执行 本 例子 的 系统 上 每 个 消息 队列 有 4096 字 节 的 限制 。 既 然 我 们 写 了 一 


个 1 字 节 数据 的 消息 ， 而 且 msg_cbytes 的 值 为 1， 那 么 该 限制 显然 只 适用 
于 消 妃 的 数据 部 分 ， 而 不 包括 与 每 个 消息 关联 的 长 整数 消 轧 类 型 。 





6.6 简单 的 程 


既然 System V 消 息 队 列 是 随 内 核 持 续 的， 我 们 就 可 以 编写 一 组 小 程 
序 来 操纵 它们 ， 以 便 观 察 效果 。 

6.6.1 msgcreate 程 序 

图 6-4 给 出 了 我 们 的 msgcreate 程 序 ， 它 创建 一 个 消息 队列 。 


svmsg/msgcreate. Cc 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

& 1 

5 int c, Oflag, maid; 

6 oflag = SVMSG MODE | IPC CREAT; 

7 while ( (c = Getopt (argc, argv, "e")) != -1) { 
8 switch (c) { 

9 capes fel: 

10 oflag |= IPC_EXCL; 

Ta break; 

12 } 

13 

14 if (optind != argc - 1) 

T5 err quit("usage: msgcreate [ -e ] «pathname»"); 
16 mqid = Msgget (Ftok(argv[optind], 0), oflag); 
2 exit (0); 

18 } 


svmsg/msgcreate.c 








图 6-4 创建 一 个 System V 消 息 队 列 





9 一 12 我 们 允许 使 用 -e 命 令 行 选 项 来 指定 IPC_EXCL 标 志 。 


16 


把 必须 由 用 户 作为 命令 行 参数 提供 的 路 径 名 作为 参数 传递 给 


ftok。 导 出 的 键 由 msgget 转 换 成 一 个 标识 符 〈 见 习题 6.1) 。 

6.6.2 msgsnd 程 序 

图 6-5 给 出 了 我 们 的 msgsnd 程 序 ， 它 把 一 个 指定 了 长 上 度 和 类 型 的 消 
ABC BIER PAI e 


svmsg/msgsnd.c 





1 #include "unpipc.h" 

2 ant 

3 main(int argc, char **argv) 

4 4 

5 int mqid; 

6 size_t len; 

7 long type; 

8 struct msgbuf *ptr; 

9 if (argc != 4) 

10 err quit("usage: msgsnd <pathname> <#bytes> <type>") ; 
zig len = atoi(argv[21); 

12 type - atoi(argv[3]); 

13 mgid - Msgget(Ftok(argv[1], 0), MSG W); 

14 ptr = Calloc(sizeof(long) + len, sizeof(char)); 
15 ptr-»mtype - type; 

16 Msgsnd(mqid, ptr, len, 0); 

17 exit (0); 

18 } 





svmsg/msgsnd.c 
图 6-5 往 一 个 System V 消 息 队 列 中 加 一 个 消息 

我 们 先 分 配 一 个 指向 通用 msgbuf 结 构 的 指针 ， 然 后 根据 待 发送 消息 
的 大 小 调用 calloc 分 配 真正 的 结构 (例如 输出 缓冲 区 )〉 。calloc 函 数 还 把 
所 分 配 的 绥 冲 区 初始 化 为 0。 

6.6.3 msgrcv 程 序 

图 6-6 给 出 了 我 们 的 msgrcv 程 序 ， 它 从 一 个 队列 中 读 出 一 个 消息 。-n 
命令 行 选 项 指定 非 阻塞 ，-t 命 令 行 选 项 指定 msgrcv 函 数 的 type 参 数 。 














svmsg/msgrcv.c 
1 #include "unpipc.h" 


2 #define MAXMSG (8192 + sizeof (long) ) 


3 int 

4 main(int argc, char **argv) 

5 { 

6 int c, flag, mqid; 

7 long type; 

8 ssize b n; 

9 struct msgbuf *buff; 

10 type = flag = 0; 

11 while ( (c = Getopt(argc, argv, "nt:")) !- -1) ( 
12 switch (c) ( 

13 case 'n': 

14 flag |- IPC NOWAIT; 

ES break; 

16 case 't': 

E7 type = atol (optarg) ; 

18 break; 

19 } 

20 } 

21 if (optind != argc - 1) 

22 err quit("usage: msgrcv [ -n ] [ -t type ] <pathname>") ; 
23 mqid = Msgget (Ftok(argv[optind], 0), MSG R); 

24 buff = Malloc (MAXMSG) ; 

25 n = Msgrcv(mqid, buff, MAXMSG, type, flag); 

26 printf("read %d bytes, type = %ld\n", n, buff-»mtype); 
27 exit(0); 

28 ) 





svmsg/msgrcv.c 


图 6-6 从 一 个 System V 消 息 队 列 中 读 出 一 个 消息 
2 没有 简单 的 方法 用 以 确定 一 个 消 恩 的 最 大 大 小 《我 们 将 在 6.10 节 
讨论 这 个 限制 及 其 他 限制 ) ， 因 此 我 们 给 它 定 义 了 上 自己 的 种 值 。 
6.6.4 msgrmid 程 序 
要 删除 一 个 消息 队列 ， 我 们 以 IPC_RMID 命 令 调 用 msgctl， 如 图 6-7 
所 示 。 








svmsg/msgrmid.c 
1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 





图 6-7 删除 一 个 System V 消 息 队列 





int mqid; 


4 

5 

6 if (argc != 2) 
7 err quit ("usage: msgrmid <pathname>") ; 
8 


mqid = Msgget (Ftok(argv[1], 0), 0); 





9 Msgct1(mqid, IPC RMID, NULL); 
10 exit (0) ; 
TT 
svmsg/msgrmid.c 
Kje-7 CH 
6.6.5 例子 
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solaris 96 msgcreate /tmp/no/such/file 

ftok error for pathname "/tmp/no/such/file" and id 0: No such file or 
directory 

solaris 96 touch /tmp/test1 

solaris % msgcreate /tmp/test1 

solaris % msgsnd /tmp/test1 1 100 

solaris % msgsnd /tmp/test1 2 200 

solaris % msgsnd /tmp/test1 3 300 

solaris 96 ipcs -qo 

IPC status from «running system»? as of Sat Jan 10 11:25:45 1998 

T ID KEY MODE 
OWNER GROUP CBYTES QNUM 

Message Quenes: 

q 100 0x0000113e --rw-r--r-- rstevens ^ otherl 
6 3 

RITE Te B H] — P AMEE W K I BE P 18 SA P], AR 
例 表 明 ftok 的 路 径 名 参数 必须 存在 。 我 们 随后 创建 文件 /tmp/test1， 并 使 


用 该 路 径 名 创建 一 个 消息 队列 。 往 该 队列 中 放置 三 个 消息 : 长 度 分 别 为 
1 字 节 、2 字 节 和 3 字 节 ， 类 型 分 别 为 100、200 和 300 (回想 图 6-1) 。ipcs 
程序 指出 这 三 个 消息 总 共 构 成 该 队列 中 的 6 个 字 节 。 

接着 展示 在 不 以 FIFO 顺 序 读 出 消 恩 时 msgrcv 的 type 参 数 的 使 用 。 


solaris % msgrcv -t 200 /tmp/test1 











read 2 bytes,type = 200 

solaris % msgrcv -t -300 /tmp/test1 

read 1 bytes,type = 100 

solaris % msgrcv /tmp/test1 

read 3 bytes,type = 300 

solaris % msgrcv -n /tmp/test1 

msgrcv error: No message of desired type 

其 中 第 一 个 例子 请 求 读 出 类 型 为 200 的 消息 ， 第 二 个 例子 请 求 读 出 
类 型 小 于 或 等 于 300 且 是 最 小 的 消息 ， 第 三 个 例子 请 求 读 出 该 队列 中 的 
第 一 个 消息 。 最 后 一 次 执行 msgrcv 程 序 用 上 了 IPC_NOWAIT 标 志 。 

如 果 我 们 给 msgrcv 指 定 一 个 正 的 type 参 数 ， 但 是 队列 中 不 存在 具有 
GRANT, ABS RETA? 


solaris % ipcs -qo 








IPC status from «running system»? as of Sat Jan 10 11:37:01 1998 

T ID KEY MODE 
OWNER GROUP CBYTES QNUM 

Message Quenes: 

q 100 0x0000113e --rw-r--r-- rstevens ^ other1 
0 0 

solaris % msgsnd /tmp/test1 1 100 

solaris % msgrcv -t 999 /tmp/test1 


2: SEA P IT BE 


终止 程序 执行 

solaris % msgrcv -n -t 999 /tmp/test1 

msgrcv error: No message of desired type 

solaris 96 grep desired /usr/include/sys/errno.h 

#define ENOMSG 35 /* No message of desired type */ 

solaris % msgrmid /tmp/test1 

我 们 首先 执行 jpcs 验 证 刚才 的 队列 是 空 的 ， 然 后 往 其 中 放置 一 个 长 
度 为 1 字 节 、 类 型 为 100 的 消息 。 当 请 求 读 出 一 个 类 型 为 999 的 消息 时 ， 
msgrcv 程 序 阻 堵 〈 阻 蹇 在 msgrcv 调 用 中 ) ， 等 待 某 个 该 类 型 的 消息 被 放 
置 到 该 队列 中 。 我 们 用 中 断 键 终 止 该 程序 以 中 断 其 中 的 阻塞 。 接 着 在 指 
定 -0 标志 以 防止 阻塞 的 前 提 下 重新 执行 msgrcv 程 序 ， 结 果 看 到 返回 
ENOMSG 错 误 。 然 后 用 我 们 的 msgrmid 程 序 从 系统 中 删除 该 队列 。 我 们 
也 可 以 使 用 由 系统 提供 的 命令 删除 该 队列 。 下 面 的 命令 指定 的 是 消 妃 队 
列 标识 符 : 

solaris % ipcrm -q 100 

下 面 的 命令 指定 的 是 消息 队列 键 : 

solaris % ipcrm -Q 0x113e 

6.6.6 msgrcvid 程 序 

要 访问 一 个 System V 消 息 队 列 ， 调 用 msgget 并 不 是 必须 的 : 我 们 只 
需 知 道 该 消息 队列 的 标识 符 〈 使 用 ipcs 极 易 得 到 ) ， 并 拥有 该 队列 的 读 
权限 。 图 6-8 是 图 6-6 中 msgrcv 程 序 的 简化 版 本 。 




















svmsg/msgrcvid.c 





1 #include "unpipc.h" 
2 #define MAXMSG (8192 + sizeof (1ong)) 


3 int 
4 main(int argc, char **argv) 


6 int mqid; 

7 ssize t n; 

8 struct msgbuf *buff; 

9 if (argc !- 2) 

10 err quit("usage: msgrcvid <mqid>") ; 
14 mqid = atoi(argv[1]); 

12 buff = Malloc (MAXMSG) ; 

253 n = Msgrcv(mqid, buff, MAXMSG, 0, 0); 
14 printf ("read %d bytes, type = %ld\n", n, buff-»mtype); 
15 exit (0); 

16 ] 


svmse/msercvid.c 





图 6-8 只 知道 标识 符 时 从 一 个 System V 消 息 队 列 中 读 

我 们 没有 调用 msgget， 而 是 由 调用 者 在 命令 行 上 指定 消 有 息 队 列 标识 
符 。 下 面 是 使 用 这 种 技巧 的 一 个 例子 。 

solaris % touch /tmp/testid 

solaris % msgcreate /tmp/testid 

solaris % msgsnd /tmp/testid 4 400 

solaris % ipcs -qo 

IPC status from «running system? as of Wed Mar 25 09:48:28 1998 


T ID KEY MODE 
OWNER GROUP CBYTES QNUM Message Queues: 

q 150  0x0000118a --rw-r--r-- rstevens otherl 
4 1 


solaris % msgrcvid 150 

read 4 bytes,type = 400 

我 们 从 ipcs 的 输出 获得 标识 符 为 150， 它 就 是 我 们 的 msgrcvid 程 序 的 
命令 行 参数 。 


同样 的 特性 也 适用 于 System V 信 号 量 〈 习 题 11.1) 和 System VÆ 
内 存 区 《习题 14.1) 。 


6.7 客户 一 服务 器 僧 





现在 我 们 把 4.2 节 中 的 客户 -服务 器 例子 编写 成 使 用 两 个 消息 队列 。 
一 个 队列 用 于 从 客户 到 服务 器 的 消息 ， 另 一 个 队列 用 于 从 服务 器 到 客户 
的 消息 。 

图 6-9 给 出 了 我 们 svmsg.h 头 文件 。 其 中 包括 了 我 们 的 标准 头 文件 
Cunpipc.h) ， 并 定义 了 两 个 消息 队列 的 键 。 





svmsgcliserv/svmsg.h 





1 #include "unpipc.h" 


2 #define MQ KEY1 1234L 


3 #define MQ KEY2 2345L 
svmsgcliserv/svmsg.h 





图 6-9 使 用 消息 队列 的 客户 -服务 器 程序 的 头 文件 
图 6-10 给 出 了 服务 器 程序 的 main 函 数 。 创 建 两 个 方向 的 消息 队列 ， 
不 过 任何 一 个 已 经 存在 也 没有 关系 ， 因 为 我 们 没有 指定 IPC_EXCL 标 
志 。server 函 数 是 图 4-30 中 所 示 的 版 本 ， 它 调用 的 mesg_send 和 mesg_recv 
函数 我 们 稍 后 给 出 。 


svmsgcliserv/server_main.c 





1 #include "svmsg.h" 
2 void server(int, int); 


3 int 

4 main(int argc, char **argv) 

51 

int readid, writeid; 

readid - Msgget(MQ KEY1, SVMSG MODE | IPC CREAT); 
writeid - Msgget(MQ KEY2, SVMSG MODE | IPC CREAT); 


server(readid, writeid); 


exit (0); 


e o to © ~] OY 
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svmsgcliserv/server_main.c 





图 6-10 使 用 消息 队列 的 服务 器 程序 main 函 数 





图 6-11 给 出 了 客户 程序 的 main 函 数 。 我 们 打开 两 个 方 回 的 消息 队 
列 ， 随 后 调用 图 4-29 中 的 dient 函 数 。 该 函数 调用 我 们 接 下 去 给 出 的 
mesg_send 和 mesg_recv 函 数 。 

client 和 server 函 数 都 使 用 网 4-25 中 所 示 的 消息 格式 。 这 两 个 函数 还 
调用 我 们 的 mesg_send 和 mesg_recv 函 数 。 图 4-27 和 图 4-28 给 出 的 这 两 个 
函数 的 版 本 调用 了 write 和 read， 这 对 于 管道 和 FIFO 是 有 用 的 ， 但 对 于 消 
息 队 列 则 需要 重新 编写 它们 。 图 6-12 和 图 6-13 给 出 了 它们 的 新 版 本 。 注 
意 ， 这 两 个 函数 的 前 后 两 个 版 本 需 传 递 的 参数 不 变 ， 因 为 第 一 个 整数 参 
数 既 可 以 含有 一 个 整数 描述 符 《〈 用 于 访问 管道 或 FIFO) ， 也 可 以 含有 一 
个 整数 消息 队列 标识 符 。 


svmsgcliserv/client_main.c 





1 #include "svmsg.h" 
2 void client (int, int); 
3 int 


4 main(int argc, char **argv) 


5 { 


6 int readid, writeid; 

7 /* assumes server has created the queues */ 
8 writeid = Msgget (MQ KEY1, 0); 

9 readid = Msgget (MQ KEY2, 0); 

10 client (readid, writeid) ; 

11 /* now we can delete the queues */ 

12 Msgctl(readid, IPC RMID, NULL); 

13 Msgctl(writeid, IPC RMID, NULL); 

14 exit (0); 

15 ) 


svmsgcliserv/client main.c 








图 6-11 使 用 消息 队列 的 客户 程序 main 函 数 








svmsgcliserv/mesg send.c 





1 include "mesg.h" 


2 ssize t 

3 mesg send(int id, struct mymesg *mptr) 

4 ( 

5 return(msgsnd(id, &(mptr-»mesg type), mptr-»mesg len, 0)); 


6) 





svmsgcliserv/mesg send.c 


图 6-12 用 于 消息 队列 的 mesg_send 函 数 





svmsgcliserv/mesg recv.c 
1 #include "mesg.h" 

2 ssize t 

3 mesg recv(int id, struct mymesg *mptr) 


4 ( 

5 ssize t n; 

6 n = msgrcv (id, &(mptr-»mesg type), MAXMESGDATA, mptr-»mesg type, 0); 
7 mptr-»mesg len - n; /* return #bytes of data */ 

8 return (n); /* -1 on error, 0 at EOF, else »0 */ 

9 





svmsgcliserv/mesg recv.c 


图 6-13 用 于 消息 队列 的 mesg_recv 函 数 


6.8 复 用 消息 








与 一 个 队列 中 的 每 个 消息 相关 联 的 类 型 字段 提供 了 两 个 特性 。 

(类 型 字段 可 用 于 标识 消息 ， 从 而 允许 多 个 进程 在 单个 队列 上 复 用 
(multiplex) 消息 。 举 例 来 说 ， 类 型 字段 的 某 个 值 用 于 标识 从 各 个 客户 
到 服务 器 的 消息 ， 对 于 每 个 客户 均 为 唯一 的 男 外 某 个 值 用 于 标识 从 服务 
器 到 各 个 客户 的 消息 。 每 个 客户 的 进程 ID 自然 可 用 作对 于 每 个 客户 均 为 
唯一 的 类 型 字段 。 

(2) 类 型 字段 可 用 作 优先 级 字段 。 这 人 允许 接收 者 以 不 同 于 先进 先 出 
(FIFO) 的 某 个 顺序 读 出 各 个 消息 。 使 用 管道 或 FIFO 时 ， 数 据 必 须 以 
写 入 的 顺序 读 出 。 使 用 System  V 消 息 队 列 时 ， 消 息 能 够 以 任意 顺序 读 
出 ， 只 要 中 与 消息 类 型 关联 的 值 一 致 就 行 。 而 且 我 们 可 以 指定 
IPC_NOWAIT 标 志 调 用 msgrcv 从 某 个 队列 中 恋 出 某 个 给 定 类 型 的 任意 消 
息 ， 但 是 如 果 没 有 给 定 类 型 的 消息 存在 ， 那 束 立 即 返 回 。 

6.8.1 例子 : 每 个 应 用 一 个 队列 

回想 我 们 那个 由 一 个 服务 器 进程 和 单个 客户 进程 构成 的 简单 应 用 例 
子 。 使 用 管道 和 FIFO 时 ， 为 在 两 个 方向 上 区 换 数 据 需 两 个 IPC 通 道 ， 
为 这 两 种 类 型 的 IPC 是 单 同 的 。 使 用 消 奶 队列 时 ， 单 个 队列 就 够 用 ， 由 
每 个 消息 的 类 型 来 标识 该 消息 是 从 客户 到 服务 器 ， 还 是 从 服务 器 到 客 

















考虑 更 为 复杂 的 情况 : 一 个 服务 器 带 多 个 客户 。 这 儿 我 们 可 以 使 用 
譬如 说 值 为 1 的 类 型 来 指示 从 任意 客户 到 服务 器 的 消 轧 。 如 果 该 客户 将 
目 己 的 进程 ID 作 为 消息 的 一 部 分 传递 ， 服 务 器 就 能 把 自己 的 消息 发 送 给 
该 客户 ， 办 法 是 把 该 客户 的 进程 ID 用 作 消 息 类 型 。 每 个 客户 然后 把 自己 
的 进程 ID 指定 为 msgrcv 的 type 参 数 。 图 6-14 展 示 了 单个 消息 队列 是 如 何 
用 于 在 多 个 客户 和 单个 服务 器 之 间 复 用 消息 的 。 









类 型 =1234 或 9876: 服务 器 应 
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PID 1234 PID 9876 


图 6-14 在 多 个 客户 和 单个 服务 器 之 闻 复 用 消息 
当 单 个 IPC 通 着 同时 由 多 个 客户 和 单个 服务 器 使 用 时 ， 总 是 存在 死 
锁 的 隐患 。 客 户 们 可 以 填 满 消息 队列 《在 本 例子 中 ) ， 妨 碍 服务 器 及 送 
应 答 。 于 是 这 些 客 户 阻 塞 在 msgsnd 中 ， 服 务 器 也 这 样 。 可 检测 这 种 死 锁 
的 办 法 之 一 是 ， 约 定 服务 器 对 消 轧 队列 总 是 使 用 非 阻 塞 写 。 
现在 改 用 单个 消 妃 队列 重新 编写 我 们 的 客户 -服务 吉 例 子 程序 ， 给 
每 个 方 回 的 消 和 县 使 用 不 同 的 消息 类 型 。 这 些 程序 使 用 这 样 的 约定 : 类 型 





为 1 的 消 恩 是 从 客户 到 服务 器 的 ， 所 有 其 他 消 肯 有 一 个 等 于 其 客户 进程 
ID 的 类 型 。 该 客户 -服务 器 应 用 要 求 每 个 客户 请 求 含有 对 应 客户 的 进程 
ID 以 及 所 请 求 的 路 径 名 ， 这 与 我 们 在 4.8 节 的 做 法 类 似 。 

图 6-15 给 出 了 服务 器 程序 的 main 函 数 。 其 中 svmsg.h 头 文件 在 网 6-9 
中 给 出 。 服 务 器 只 创建 一 个 消息 队列 ， 如 果 它 已 经 存在 ， 那 也 没有 关 
系 。 给 server 函 数 的 两 个 参数 所 用 的 是 同一 个 消 筷 队列 标识 符 


svmsgmpx1q/server_main.c 











1 #include "svmsg.h" 
2 void server(int, int); 
3 int 


4 main(int argc, char **argv) 


5 { 


6 int msqid; 

7 msqid = Msgget (MQ_KEY1, SVMSG MODE | IPC_CREAT) ; 

8 server (msqid, msqid) ; /* same queue for both directions */ 
9 exit (0); 


10 } 
svmsgmpx1q/server_main.c 


图 6-15 服务 器 程序 main 函 数 


server 函 数 完成 所 有 的 服务 器 处 理 ， 在 图 6-16 中 给 出 。 该 函数 是 图 4- 
23 和 图 4-30 的 组 合 ， 其 中 图 4-23 是 恋 出 由 一 个 进程 ID 和 一 个 路 径 名 构成 
的 命令 的 FIFO 服 务 器 程序 ， 图 4-30 则 使 用 了 我 们 的 mesg_send 和 
mesg_recv 疯 数 。 注 意 ， 由 某 个 客户 发 送 的 进程 ID 用 作 由 服务 器 发 送 给 
该 客户 的 所 有 消息 的 消息 类 型 。 这 个 server 函 数 还 是 一 个 调用 一 次 后 永 
不 返回 的 无 限 循 环 ， 每 次 循环 读 出 一 个 客户 请 求 并 发 回应 答 。 这 是 个 迭 
代 服 务 器 ， 如 4.9 节 中 讨论 的 那样 。 








svmsgmpx 1 q/server.c 








1 #include "mesg.h" 
2 void 
3 server(int readfd, int writefd) 
a 1 
5 FILE *fp; 
6 char *ptr; 
7 pid t pid; 
8 ssize t n; 
9 struct mymesg mesg; 
10 for (2:594 
11 /* read pathname from IPC channel */ 
12 mesg.mesg type - 1; 
13 if ( (n = Mesg recv(readfd, &mesg)) == 0) { 
14 err msg("pathname missing"); 
15 continue; 
16 } 
17 mesg.mesg data[n] = '\0'; /* null terminate pathname */ 
18 if ( (ptr = strchr(mesg.mesg data, ' ')) == NULL) { 
19 err_msg("bogus request: %s", mesg.mesg data); 
20 continue; 
21 ) 
22 *ptr++ = 0; /* null terminate PID, ptr = pathname */ 
23 pid = atol(mesg.mesg data) ; 
24 mesg.mesg type = pid; /* for messages back to client */ 
25 if ( (fp = fopen(ptr, "r")) == NULL) { 
26 /* error: must tell client */ 
27 snprintf (mesg.mesg data + n, sizeof(mesg.mesg data) - n, 
28 ": can't open, %s\n", strerror(errno)); 
29 mesg.mesg len - strlen(ptr); 
图 6-16 server K Zi 
30 memmove (mesg.mesg data, ptr, mesg.mesg len); 
3T Mesg send(writefd, &mesg) ; 
32 ) eise { 
33 /* fopen succeeded: copy file to IPC channel */ 
34 while (Fgets(mesg.mesg data, MAXMESGDATA, fp) !- NULL) ( 
35 mesg.mesg len - strlen(mesg.mesg data); 
36 Mesg send(writefd, &mesg); 
37 ) 
38 Fclose (fp); 
39 ) 
40 /* send a 0-length message to signify the end */ 
41 mesg.mesg len - 0; 
42 Mesg send(writefd, &mesg); 
43 } 
44 } 


MM  svmsgmpx Igfserver.c 


图 6-16 (42) 


图 6-17 给 出 了 客户 程序 的 main 函 数 。 客 户 打 开 唯 一 的 消 轧 队列 ， 它 
必须 已 由 服务 器 创建 。 





svmsgmpx1q/client_main.c 
1 #include "svmsg.h" 


2 void client (int, int); 
3 int 

4 main(int argc, char **argv) 
5 { 

6 int msqid; 


/* server must create the queue */ 


8 msqid = Msgget (MQ KEY1, 0); 

9 client (msqid, msqid) ; /* same queue for both directions */ 
10 exit (0) ; 

aa: } 


svmsgmpx1q/client_main.c 








图 6-17 客户 程序 main 函 数 
图 6-18 所 示 的 client 函 数 为 我 们 的 客户 完成 所 有 处 理 。 该 函数 是 图 4- 
24 和 图 4-29 的 组 合 ， 其 中 图 4-24 发 送 一 个 进程 ID 后 跟 一 个 路 径 名 ， 图 4- 
29 使 用 了 我 们 的 mesg_send 和 mesg_recv 函 数 。 注 意 从 mesg_recv 请 求 的 消 
上 县 类 型 等 于 当前 客户 的 进程 ID。 











svmsgmpx I q/client.c 


1 #include "mesg.h" 

2 void 

3 client(int readfd, int writefd) 
41 


5 sizet len; 

6 ssize t n; 

7 char *ptr; 

8 struct mymesg mesg; 


9 /* start buffer with pid and a blank */ 
10 snprintf (mesg.mesg data, MAXMESGDATA, "$ld ", (long) getpid()); 
aut len - strlen(mesg.mesg data); 





图 6-18 client Pk Zi 





12 ptr = mesg.mesg data + len; 





13 /* read pathname */ 
14 Fgets (ptr, MAXMESGDATA - len, stdin); 
T5 len = strlen(mesg.mesg data); 
16 if (mesg.mesg data[len-1] == '\n') 
aliri len--; /* delete newline from fgets() */ 
18 mesg.mesg_len = len; 
T9 mesg.mesg type - 1; 
20 /* write PID and pathname to IPC channel */ 
21 Mesg send(writefd, &mesg); 
22 /* read from IPC, write to standard output */ 
23 mesg.mesg type - getpid(); 
24 while ( (n = Mesg recv(readfd, &mesg)) > 0) 
25 Write(STDOUT FILENO, mesg.mesg data, n); 
26 ) 
svmsgmpx I q/client.c 
图 6-18 È) 
我 们 的 client 和 server 函 数 都 使 用 网 6-12 和 图 6-13 中 的 mesg_send 和 
mesg_recvef Zi. 





6.8.2 例子 : 每 个 客户 一 个 队列 

现在 把 前 面 的 例子 改 成 给 去 往 服务 器 的 所 有 客户 请 求 使 用 一 个 队 
列 ， 给 每 个 客户 使 用 一 个 队列 接收 去 往 各 个 客户 的 服务 器 应 答 。 图 6-19 
展示 了 这 样 的 设计 。 


子 进 程 父 进程 子 进程 






服务 器 











众所周知 的 键 文件 内 容 





文件 内 容 






IPC_PRIVATE 





图 6-19 每 个 服务 器 一 个 队列 ， 每 个 客户 一 个 队列 





服务 器 的 队列 有 一 个 对 客户 来 说 众所周知 的 键 ， 但 是 各 个 客户 以 
IPC_PRIVATE 键 创建 各 自 的 队列 。 这 里 并 未 随 请 求 传递 本 进程 ID， 而 
是 由 每 个 客户 把 自己 的 私 用 队列 的 标识 符 传 递 给 服务 器 ， 服 务 器 把 自己 
的 应 答 发 送 到 由 客户 指出 的 队列 中 。 我 们 还 以 并 发 服务 器 模型 编写 这 个 
服务 器 程序 ， 给 每 个 客户 fork 一 次 。 

这 种 设计 的 潜在 问题 之 一 发 生 在 某 个 客户 中 途 死 亡 时 ， 这 种 情况 下 
它 的 私 用 队列 中 可 能 永远 残留 消息 (或 者 至 少 到 内 核 重 新 自 举 或 某 个 用 
户 显 式 地 删除 该 队列 为 止 ) 。. 

下 列 头 文件 和 函数 跟 以 前 的 版 本 一 样 : 

mesg.h 汰 文件 (图 4-25) ; 

svmsg.h 尖 文件 (图 6-9) ; 

服务 器 程序 main 函 数 〈 图 6-15) ; 

mesg_send 函 数 〈 图 4-27) 。 





图 6-20 给 出 了 我 们 的 客户 程序 main 函 数 ， 它 与 图 6-17 的 差别 很 小 。 
它 打开 服务 器 的 众所周知 队列 〈MQ_KEY1) ， 然 后 用 IPC_PRIVATE 键 
创建 自己 的 队列 。 这 两 个 队列 标识 符 成 为 dient 函 数 ( 图 6-21)〉 的 参数 。 
当 客 户 运行 完 时 ， 它 的 私 用 队列 被 删除 。 


svmsgmpxnq/client_main.c 














1 #include "svmsg.h" 
2 void client (int, int); 
3 int 
4 main(int argc, char **argv) 
5 { 
6 int readid, writeid; 
7 /* server must create its well-known queue */ 
8 writeid = Msgget (MQ_KEY1, 0); 
9 /* we create our own private queue */ 
10 readid = Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT) ; 
11 client (readid, writeid); 
12 /* and delete our private queue */ 
13 Msgctl(readid, IPC RMID, NULL); 
14 exit (0); 
15 } 
svmsgmpxnq/client main.c 
图 6-20 客户 程序 main 函 数 
svmsgmpxnq/client.c 
1 #include "mesg.h" 
2 void 
3 client (int readid, int writeid) 
4 { 
5 size t len; 
6 ssize t n; 
7 char *ptr; 
8 struct mymesg mesg; 
9 /* start buffer with msgid and a blank */ 
10 snprintf (mesg.mesg data, MAXMESGDATA, "$d ", readid); 
11 len = strlen(mesg.mesg data); 
12 ptr = mesg.mesg data + len; 
13 /* read pathname */ 
14 Fgets(ptr, MAXMESGDATA - len, stdin); 
15 len = strlen(mesg.mesg data); 
16 if (mesg.mesg data[len-1] == '\n') 
17 len--; /* delete newline from fgets() */ 
18 mesg.mesg len - len; 
19 mesg.mesg_type = 1; 





图 6-21 client pk BL 





20 /* write msqid and pathname to server's well-known queue */ 


21 Mesg_send(writeid, &mesg) ; 

22 /* read from our queue, write to standard output */ 
23 while ( (n = Mesg recv(readid, &mesg)) > 0) 

24 Write (STDOUT_FILENO, mesg.mesg data, n); 

25 } 


svmsgmpxnq/client.c 





图 6-21 (5D 


图 6-21 是 client 函 数 。 该 函数 与 图 6-18 几 乎 相同 ， 但 是 作为 请 求 的 一 
部 分 传递 的 是 本 客户 的 私 用 队列 标识 符 ， 而 不 是 本 客户 的 进程 ID。mesg 
结构 中 的 消息 类 型 仍 保留 为 1， 因 为 它 是 两 个 方向 的 消息 都 使 用 的 类 
型 。 

图 6-23 是 server 函 数 。 与 图 6-16 相 比 的 主要 变化 是 将 这 个 函数 编写 为 
一 个 无 限 循 环 ， 每 次 循环 给 一 个 客户 请 求 调用 fork。 

给 SIGCHLD 建 立信 号 处 理 程 序 

10 既然 是 在 给 每 个 客户 派生 一 个 子 进程 ， 我 们 必须 顾虑 僵尸 进 
程 。UNPv1 的 5.9 节 和 5.10 节 详细 讨论 了 这 一 点 。 这 里 我 们 给 SIGCHLD 
信号 建立 一 个 信号 处 理 程序 ， 这 样 当 某 个 子 进 程 终 止 时 ， 我 们 的 
sig_chld (图 6-22) 就 被 调用 。 

12—18 服务 器 父 进程 阻塞 在 mesg_recv 调 用 中 ， 等 待 下 一 个 客户 消 
ITI BDA 

25~45 ”调用 fork 派 生 一 个 子 进程 ， 由 子 进程 尝试 打开 所 请 求 的 文 
件 ， 发 回 一 个 出 错 消息 或 该 文件 的 内 容 。 我 们 特意 把 fopen 调 用 放 在 子 
进程 而 不 是 父 进 程 中 ， 以 防 该 文件 在 某 个 远程 文件 系统 上 ， 因 为 要 是 这 
样 ， 如 果 发 生 任 何 网 络 问题 ， 文 件 的 打开 就 可 能 花 一 段 时 间 。 

图 6-22 给 出 了 SIGCHLD 信 号 的 处 理 程序 。 它 复制 自 UNPv1 的 图 5- 
11。 











svmsgmpxnq/sigchldwaitpid.c 





1 #include "unpipc.h" 

2 void 

3 sig chld(int signo) 

4 ( 

5 pidt pid; 

6 int stat; 

7 while ( (pid = waitpid(-1, &stat, WNOHANG)) > 0) ; 
8 return; 

9 j 


svmsgmpxnq/sigchldwaitpid.c 


























图 6-22 调用 waitpid 的 SIGCHLD 信 号 处 理 程序 

每 次 调用 我 们 的 信号 处 理 程序 时 ， 它 束 在 一 个 循环 中 调用 waitpid， 
以 取得 已 终止 的 任何 子 进 程 的 终止 状态 。 该 信号 处 理 程 序 随后 返回 。 这 
可 能 造成 一 个 问题 ， 因 为 父 进程 会 把 大 部 分 时 间 花 在 阻 才 在 mesg_recvV 
函数 《图 6-13) 的 msgrcv 调 用 中 。 当 我 们 的 信号 处 理 程序 返回 时 ， 这 个 
msgrcv 调 用 就 被 中 断 。 也 束 是 说 该 函数 将 返回 一 个 EINTR 错 误 ， 如 
UNPv1 的 5.9 节 所 述 。 

我 们 必须 处 理 这 个 被 中 断 的 系统 调用 ， 图 6-24 给 出 Mesg_recv 包 囊 
函数 的 新 版 本 。 它 允许 有 来 和 目 mesg_recv 的 EINTR 错 误 (mesg_recv 只 是 
调用 msgrcv) ， 如 果 发 生 该 错误 ， 那 就 再 次 调用 mesg_recv。 











svmsgmpxnq/server.c 


1 #include "mesg.h" 

2 void 

3 server(int readid, int writeid) 

4 { 

5 FILE *fp; 

6 char *ptr; 

7 ssize t mn; 

8 struct mymesg mesg; 

9 void sig chld(int); 

10 Signal(SIGCHLD, sig chld); 

stu tor (77) 4 

12 /* read pathname from our well-known queue */ 

13 mesg.mesg type = 1; 

14 if ( (n = Mesg recv(readid, &mesg)) == 0) { 

15 err msg("pathname missing"); 

16 continue; 

17 } 

18 mesg.mesg data[n] = '\0'; /* null terminate pathname */ 
19 if ( (ptr = strchr(mesg.mesg data, ' ')) == NULL) { 

20 err msg("bogus request: %s", mesg.mesg data); 

21. continue; 

22 ) 

23 *ptr++ = 0; /* null terminate msgid, ptr = pathname */ 
24 writeid = atoi(mesg.mesg_data) ; 

25 if (Fork() == 0) { /* child */ 

26 if ( (fp = fopen(ptr, "r")) == NULL) { 

27 /* error: must tell client */ 

28 snprintf (mesg.mesg data + n, sizeof(mesg.mesg data) - n, 
29 ": can't open, %s\n", strerror (errno) ) ; 

30 mesg.mesg len = strlen(ptr) ; 

31 memmove (mesg.mesg data, ptr, mesg.mesg_ len) ; 

32 Mesg send(writeid, &mesg); 

33 ) eise { 

34 /* fopen succeeded: copy file to client's queue */ 
35 while (Fgets(mesg.mesg data, MAXMESGDATA, fp) !- NULL) { 
36 mesg.mesg len - strlen(mesg.mesg data); 

37 Mesg send(writeid, &mesg); 

38 ) 

39 Fclose(fp); 

40 } 

41 /* send a 0-length message to signify the end */ 

42 mesg.mesg len = 0; 

43 Mesg send(writeid, &mesg) ; 

44 exit (0); /* child terminates */ 

45 } 

46 /* parent just loops around */ 

47 } 

48 } 





svmsgmpxndq/server.c 


图 6-23 server pk] Zi 


svmsgmpxnq/mesg recv.c 





10 ssize t 
11 Mesg recv(int id, struct mymesg *mptr) 
12: { 


13 ssize tn; 

14 do ( 

15 n - mesg recv(id, mptr); 

16 } while (n == -1 && errno == EINTR); 
17 IE (mna 1) 

18 err sys("mesg recv error"); 

19 return (n); 


20 ) 
svmsgmpxnq/mesg recv.c 
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6.9 消息 队列 上 使 用 select 和 pol 


System V 消 息 队 列 的 问题 之 一 是 它们 由 各 自 的 标识 符 而 不 是 描述 符 
标识 。 这 意味 着 我 们 不 能 在 消息 队列 上 直接 使 用 select 或 poll CUNPv1 第 
Git) 。 

实际 上 有 一 个 版 本 的 Unix 〈 即 IBM 的 AIX) 把 select 扩 展 成 能 够 在 描 
述 符 之 外 处 理 System V 消 息 队 列 。 不 过 这 是 不 可 移植 的 ， 只 适用 于 
AIX. 

当 有 人 想 编 写 一 个 同时 处 理 网 络 连接 和 IPC 连 接 的 服务 器 程序 时 ， 
这 种 缺失 的 特性 往往 暴露 出 来 。 使 用 套 接 字 API 或 XTI API CUNPv1) 的 
网 络 通 信使 用 的 是 描述 符 ， 因 而 允许 使 用 select 或 poll。 管 道 和 FIFO 也 适 
合 这 两 个 函数 ， 因 为 它们 也 是 由 描述 符 标 识 的 。 

解决 该 问题 的 办 法 之 一 是 : 让 服务 器 创建 一 个 管道 ， 然 后 派生 一 个 
子 进程 ， 由 子 进程 阻 塞 在 msgrcv 调 用 中 。 当 有 一 个 消息 准备 好 被 处 理 
时 ，msgrcv 返 回 ， 子 进程 接着 从 所 指定 的 队列 中 读 出 该 消息 ， 并 把 该 消 
妨 写 入 管道 。 服 务 器 父 进 程 当 时 可 能 在 该 管道 以 及 一 些 网 络 连 接 上 
select。 这 种 办 法 的 负面 效果 是 消息 被 处 理 了 三 次 : 一 次 是 在 子 进程 使 
用 msgrcv 读 出 时 ， 一 次 是 在 子 进 程 写 入 管道 时 ， 最 后 一 次 是 在 父 进程 从 























该 管道 中 读 出 时 。 为 避免 这 样 的 额外 处 理 ， 父 进程 可 以 创建 一 个 在 它 自 
员 和 子 进 程 之 间 分 享 的 共享 内 存 区 ， 然 后 把 管道 用 作 父 子 进 程 间 的 一 种 
标志 《习题 12.5) 。 

在 图 5-14 中 我 们 给 出 了 一 种 不 需要 fork 就 在 Posix 消 息 队 列 上 间接 使 
用 select 或 poll 的 办 法 。 在 Posix 消 县 队列 上 可 以 只 使 用 单个 进程 的 原因 是 
它们 提供 了 通知 能 力 ， 当 某 个 空 队 列 上 有 一 个 消息 到 达 时 ， 这 种 通知 能 
力 将 产生 一 个 信号 。System V 消 息 队 列 不 提供 这 种 能 力 ， 因 此 必须 fork 
一 个 子 进程 ， 由 该 子 进 程 阻 塞 在 msgrcv 调 用 中 。 

与 网 络 编程 相 比 ，System V 消 息 队 列 另 一 个 缺失 的 特性 是 无 法 条 探 
一 个 消息 ， 而 这 是 recv、recvform 和 recvmsg 函 数 的 MSG_PEEK 标 志 提 供 
的 能 力 ON [10] ) 。 要 是 提供 了 这 种 能 力 ， 刚 刚 描 述 的 
《用 于 绕 过 select 问 题 的 ) 父子 进 程 情形 就 可 以 做 得 更 为 有 效 ， 办 法 是 
让 子 进 程 指定 msgrcv 的 示 探 标志 ， 当 有 一 个 消息 准备 好 时 束 写 1 个 字 贡 
到 管道 中 ， 以 通知 父 进程 读 出 该 消息 。 
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正如 3.8 节 中 所 指出 的 那样 ， 消 旦 TEE a 
图 6-25 给 出 了 两 种 实现 上 的 这 些 值 。 第 一 栏 是 内 容 为 所 说 明 限 制 值 的 内 
核 变 量 的 传统 SystemV 名 字 。 


SEAT B B SCA TX 8 192 2 048 


FEfT— ARENA ERA: 15 16 384 4 096 
系统 范围 的 最 大 消息 队列 数 
系统 范围 的 最 大 消息 数 





图 6-25 System V 消 息 队列 的 典型 系统 限制 








许多 源 自 SVR4 的 实现 还 有 从 它们 的 初始 实现 继承 来 的 额外 限制 : 
msgssz 和 msgseg。msgssz 往 往 是 8， 这 是 存放 消息 数据 的 “ 节 
(segment) ”的 大 小 (单位 为 字 节 〉 。 一 个 21 字 节 数 据 的 消息 将 存放 在 
3 个 这 样 的 节 中 ， 其 中 最 后 一 节 的 后 3 个 字 节 未 用 上 。msgseg 是 分 配 了 的 
节 数 ， 往 往 是 1 024。 因 历史 原因 ， 它 一 直 存 放 在 某 个 短 整 数 中 ， 因 而 
必须 小 于 32 ”768。 所 有 消息 数据 的 总 共 可 用 字 节 数 是 这 两 个 变量 的 乘 
积 ， 通 常 是 8x1 024=8 192 字 节 。 

本 节 的 目的 是 输出 一 些 典型 值 ， 以 辅助 在 代码 移植 上 所 作 的 计划 。 
当 一 个 系统 运行 大 量 使 用 消息 队列 的 应 用 时 ， 这 些 参数 或 类 似 参 数 ) 
的 内 核 微调 通常 是 必需 的 (关于 内 核 参 数 微调 已 在 3.8 节 中 讲述 过 ) 。 

例子 

图 6-26 给 出 了 确定 图 6-25 中 所 示 四 个 限制 值 的 程序 。 




















svmsg/limits.c 





1 #include "unpipc.h" 


2 #define MAX DATA 64*1024 
3 #define MAX NMESG 4096 

4 #define MAX NIDS 4096 

5 int max mesg; 


6 struct mymesg { 
7 long type; 
8 char data [MAX DATA]; 


9 } mesg; 

10 int 

11 main(int argc, char **argv) 

12 { 

13 int i, j, msgid, qid[MAX NIDS]; 

14 /* first try and determine maximum amount of data we can send */ 
15 msqid = Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 

16 mesg.type - 1; 

17 for (i = MAX DATA; i > 0; i -= 128) ( 

18 if (msgsnd(msqid, &mesg, i, 0) == 0) { 

19 printf ("maximum amount of data per message = %d\n", i); 
20 max_mesg = i; 

21 break; 























图 6-26 确定 System V 消 息 队 列 上 的 系统 限制 





22 } 


23 if (errno != EINVAL) 

24 err sys("msgsnd error for length %d", i); 

25 ) 

26 if (X == 0) 

27 err quit("i -- 0"); 

28 Msgctl(msqid, IPC RMID, NULL); 

29 /* see how many messages of varying size can be put onto a queue */ 
30 mesg.type - 1; 

31 for (i = 8; i <= max mesg; i *= 2) { 

32 msqid - Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
33 for (j = 0; j < MAX NMESG; j++) { 

34 if (msgsnd(msqid, &mesg, i, IPC NOWAIT) !- O) ( 

35 if (errno == EAGAIN) 

36 break; 

37 err sys("msgsnd error, i = $d; J - td", i, j); 
38 break; 

39 } 

40 } 

41 printf ("%d %d-byte messages were placed onto queue,", j, i); 
42 printf (" $d bytes total\n", i*j); 

43 Msgctl(msqid, IPC_RMID, NULL); 

44 } 

45 /* see how many identifiers we can "open" */ 

46 mesg.type = 1; 

47 for (i = 0; i <= MAX_NIDS; i++) { 

48 if ( (qid[i] = msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT)) == -1) { 
49 printf("$d identifiers open at once\n", i); 

50 break; 

51 ) 

52 ) 

53 for (mi: g Say JEn 

54 Msgctl(gid[j], IPC RMID, NULL); 

55 exit (0); 

56 ) 


svmsg/limits.c 
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确定 最 大 消息 大 小 

14—28 为 确定 最 大 消息 大 小 ， 我 们 党 试 发 送 一 个 含有 65536 字 节 数 
EAA, MRAM SME a eS, 
直到 msgsnd 调 用 成 功 为 止 。 

确定 一 个 队列 中 可 放置 多 少 不 同 大 小 消息 

29—44 从 8 字 节 消息 开始 查看 一 个 给 定 队 列 上 能 放置 多 少 消息 。 一 
旦 确定 该 限制 值 ， 我 们 就 删除 其 队列 (丢弃 其 中 的 所 有 消息 ) ， 并 以 16 








字 节 消息 再 次 尝试 。 这 样 一 直 尝 试 到 超过 第 一 个 步骤 中 确定 的 最 大 消息 
大 小 为 止 。 我 们 预期 较 小 的 消息 将 在 遇 到 每 队列 总 消息 数 的 限制 ， 较 大 
的 消息 将 遇 到 每 队列 总 字 节 数 的 限制 。 

确定 同时 可 打开 多 少 标识 符 

A5~54 ”任何 时 刻 能 打开 着 的 消息 队列 标识 符 最 大 数目 通常 存在 一 
个 系统 限制 。 我 们 通过 一 直 创 建 队 列 直到 msgget 失 败 来 确定 该 限制 。 

我 们 先 在 Solaris 2.6 下 运行 该 程序 ， 接 着 在 Digital Unix 4.0B 下 运 
行 ， 结 果 符 合 图 6-25 中 所 示 的 值 。 


solaris % limits 








maximum amount of data per message = 2048 

40 8-byte messages were placed onto queue,320 bytes total 

40 16-byte messages were placed onto queue,640 bytes total 
40 32-byte messages were placed onto queue, 1280 bytes total 
40 64-byte messages were placed onto queue,2560 bytes total 
32 128-byte messages were placed onto queue,4096 bytes total 
16 256-byte messages were placed onto queue,4096 bytes total 
8 512-byte messages were placed onto queue,4096 bytes total 
4 1024-byte messages were placed onto queue,4096 bytes total 
2 2048-byte messages were placed onto queue,4096 bytes total 
50 identifiers open at once 

alpha % limits 

maximum amount of data per message = 8192 

40 8-byte messages were placed onto queue,320 bytes total 

40 16-byte messages were placed onto queue,640 bytes total 
40 32-byte messages were placed onto queue, 1280 bytes total 
40 64-byte messages were placed onto queue,2560 bytes total 
40 128-byte messages were placed onto queue,5120 bytes total 


40 256-byte messages were placed onto queue,10240 bytes total 

32 512-byte messages were placed onto queue,16384 bytes total 

16 1024-byte messages were placed onto queue,16384 bytes total 

8 2048-byte messages were placed onto queue, 16384 bytes total 

4 4096-byte messages were placed onto queue,16384 bytes total 

2 8192-byte messages were placed onto queue,16384 bytes total 

63 identifiers open at once 

Digital Unix 下 输出 63 个 标识 符 的 限制 ， 而 不 是 图 6-25 所 示 的 64 个 ， 
其 原因 在 于 已 有 一 个 系统 守护 进程 在 使 用 一 个 标识 符 。 


6.11 小 结 


System V 消 息 队 列 与 Posix 消 息 队 列 类 似 。 新 的 应 用 程序 应 考虑 使 用 
Posix 消 息 队 列 ， 不 过 大 量 的 现 有 代码 使 用 System V 消 息 队 列 。 然 而 把 一 
个 应 用 程序 从 使 用 System V 消 息 队 列 重 新 编写 成 使 用 Posix 消 息 队 列 不 是 
人 
消息 的 能 力 。 这 两 种 消息 队列 都 不 使 用 真正 的 描述 符 ， 从 而 造成 在 消息 
队列 上 使 用 a 的 困难 。 


习题 


6.1 修改 图 6-4 中 的 程序 以 接受 IPC_PRIVATE 这 样 的 路 径 名 参数 ， 若 
指定 了 这 样 的 参数 ， 就 以 一 个 私 用 键 创建 一 个 消息 队列 。 这 么 一 来 ， 
6.6 节 中 的 其 余 程 序 必 须 如 何 变动 ? 

6.2 ”在 图 6-14 中 ， 我 们 为 什么 为 发 送 给 服务 器 的 消息 使 用 1 这 个 类 
型 ? 

6.3 在 图 6-14 中 ， 要 是 一 个 恶意 的 客户 向 服务 器 发 送 了 许多 消息 
但 它 从 来 不 去 读 服 务 器 的 应 答 ， 那 么 会 发 生 什 么 ? 图 6-19 对 于 这 种 类 型 





的 客户 有 什么 变动 ? 
6.4 重新 编写 5.8 节 中 Posix 消 息 队 列 的 实现 ， 改 用 System V 消 息 队 列 
SE PS TERTIO. 





[1]. 此 处 为 UNPv1 第 2 版 英文 原版 书页 码 ， 第 3 版 英文 原版 书 为 第 774 一 
775 页 。 一 一 编者 注 





[2]. 此 处 为 APUE 第 1 版 英文 原版 书 节 号 ， 第 2 版 为 15.3 节 。 一 一 编 者 注 
BL 由 原因 推出 结果 。 一 一 编者 注 


[4]. 一 个 消息 队列 的 名 字 在 系统 中 的 存在 本 里 也 占用 其 引用 计数 占 的 一 
个 引用 数 。mq_unlink 从 系统 中 删除 该 名 字 意 味 着 同时 将 其 引用 计数 减 
1， 硝 变 为 0 则 真正 拆除 该 队列 。 译 者 注 


[5]. 跟 mq_unlink 一 样 ，mq_close 也 将 当前 消息 队列 的 引用 计数 减 1， 知 
变 为 0 则 附带 拆除 该 队列 。 PEATE 


[6]. 此 处 为 APUE 第 1 版 英文 原版 书 闻 号 ， 第 2 版 的 17.4.1 节 讲述 通过 管道 
传递 文件 描述 符 。 一 一 编者 注 


[7]. 在 由 Posix.1 定 义 的 所 有 结构 中 Caiocb. group. itimerspec. lock, 
mq_attr、passwd、sched_param、sigaction、sigevent、siginfo_t、sival、 
stat, termio, timespec. utimbuf) ， 只 有 siginfo_t 是 使 用 typedef 定 义 
的 。Posix.1 给 它 的 所 有 简单 系统 数据 类 型 (pidt, pthread t) 的 名 字 
添上 _t 后 级 ， 但 它们 没有 一 个 必须 是 结构 ， Posix.1 也 没有 给 这 些 数据 类 
型 的 任何 一 个 定义 结构 成 员 名 。 因 此 把 一 个 必须 是 结构 的 数据 类 型 定义 
为 加 _t 后 级 的 siginfo_t 导 臻 作者 认为 是 一 个 错误 。 这 个 古怪 现象 的 原因 
也 许 是 因为 siginfo_t 是 由 SVR4 定 义 的 ， 后 来 Posix 一 直 忽 略 它 ， 直 到 发 
展 到 P1003.4 实 时 扩展 为 止 。 事 实 上 1003.1b-1993 第 354 页 谈 到 该 名 字 破 
坏 了 约定 ， 所 列 的 原因 是 为 了 遵循 已 有 的 实践 ， 从 而 提高 可 移植 性 。 


[8]. 无 论 何 时 处 理 不 止 一 种 实时 信和 号， 我 们 都 必须 给 每 种 实时 信号 的 信 

号 处 理 函 数 指定 一 个 sa_mask 值 ， 该 掩 码 应 该 阻塞 所 有 剩余 的 值 较 大 的 
《 即 优先 级 较 低 的 ) 实时 信号 。Posix 规 则 保证 当 有 多 种 实时 信和 号 待 处 

理 时 ， 值 最 小 的 信号 最 先 递 交 ， 然 而 保证 较 低 优先 级 的 实时 信号 不 中 断 























(HE. Re DEI 函数 指定 一 个 
sa_mask 值 来 做 到 这 一 


[9]. 既然 本 例子 中 所 有 三 种 实时 信和 号 都 从 信号 处 理 函 数 中 相互 阻 故 了 ， 
也 就 是 次 在 执行 共 个 信号 的 处 理 函 数 期 间 ， 其 他 信和 号 不 会 递 艾 ， 因 而 不 
会 中 断 当 前 信号 处 理 函 数 的 执行 ， 这 种 情况 下 把 printf 作 为 一 个 简单 的 
诊断 工具 来 调用 也 许可 行 。 然 而 输出 各 个 信号 递交 顺序 的 更 好 技巧 之 一 
是 按 下 述 修改 图 5-17。 首 先 分 配 两 个 全 局 变量 : 


[10]. 此 处 为 UNPv1 第 2 版 英文 原版 书页 码 ， 第 3 版 为 第 388 页 。 一 一 编 者 
注 


7.1 概述 


从 本 章 开 始 关 于 同步 的 讨论 : 怎样 同步 多 个 线程 或 多 个 进程 的 活 
动 。 为 允许 在 线程 或 进程 间 共 享 数据 ， 同 步 通 向 是 必需 的 。 互 斥 锁 和 条 
件 变 量 是 同步 的 基本 组 成 部 分 。 

互 斥 锁 和 条 件 变 量 出 自 Posix.1 线 程 标准 ， 它 们 总 是 可 用 来 同步 一 个 
进程 内 的 各 个 线程 的 。 如 果 一 个 互 斥 锁 或 条 件 变量 存放 在 多 个 进程 间 共 
享 的 某 个 内 存 区 中 ， 那 么 Posix 还 允许 它 用 于 这 些 进程 间 的 同步 。 

这 在 Posix 是 个 选项 ， 在 Unix 98 却 是 必需 的 (参见 图 1-5 中 IPC 类 型 
为 “进程 间 共 享 的 互 斥 锁 / 条 件 变 量 ” 的 那 一 行 ) 。 

本 章 中 我 们 将 介绍 经 典 的 生产 者 -消费 者 问题 ， 并 在 解决 该 问题 的 
方案 中 使 用 互 斥 锁 和 条 件 变量 。 对 于 本 例子 ， 我 们 使 用 多 个 线程 而 不 是 
多 个 进程 ， 因 为 让 多 个 线程 共享 本 问题 中 采用 的 公共 数据 缓冲 区 非常 简 
单 ， 而 在 多 个 进程 间 共 享 一 个 公共 数据 缓冲 区 却 需要 某 种 形式 的 共享 内 
存 区 (将 在 第 4 部 分 中 讲述 ) 。 我 们 将 在 第 10 章 中 提供 使 用 信号 量 解决 
该 问题 的 其 他 方案 。 























7.2 H Fe: 上 锁 与 解锁 


互 斥 锁 指 代 相 互 排斥 Cmutual = exclusion) ， 它 是 最 基本 的 同步 形 
式 。 互 斥 锁 用 于 保护 临界 区 《〈critical region) ， 以 保证 任何 时 刻 只 有 一 
个 线程 在 执行 其 中 的 代码 《假设 互 斥 锁 由 多 个 线程 共享 ) ， 或 者 任何 时 
刻 只 有 一 个 进程 在 执行 其 中 的 代码 《假设 互 斥 锁 由 多 个 进程 共享 ) 。 保 
护 一 个 临界 区 的 代码 的 通常 轮廓 大 体 如 下 : 

lock_the_mutex(...); 

临界 区 

unlock_the_mutex(...); 

BRYA TE AAT INT IDA A AS ZEE Be Ue BE 7 ER EY EA, EE 
的 代码 保证 任何 时 刻 只 有 一 个 线程 在 执行 其 临界 区 中 的 指令 。 

Posix 互 斥 锁 被 声明 为 具有 pthread_mnutex_t 数 据 类 型 的 变量 。 如 果 互 
斥 锁 变量 是 静态 分 配 的 ， 那 么 我 们 可 以 把 它 初始 化 成 常 值 
PTHREAD_MUTEX_INITIALIZER， 例 如 : 

static pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER; 

如 果 互 斥 锁 是 动态 分 配 的 〈 例 如 通过 调用 malloc) ， 或 者 分 配 在 共 
享 内 存 区 中 ， 那 么 我 们 必须 在 运行 之 时 通过 调用 pthread_mnutex_init 函 数 
来 初始 化 它 ， 如 7.7 节 中 所 示 。 

你 可 能 会 位 到 省 略 了 初始 化 操作 的 代码 ， 因 为 它 所 在 的 实现 把 初始 
化 常 值 定义 为 0 而且 靛 态 分 配 的 变量 被 自动 地 初始 化 为 0〉。 不 过 这 是 
不 正确 的 代码 。 

下 列 三 个 函数 给 一 个 互 斥 锁 上 锁 和 解锁 : 

#include <pthread.h> 








int pthread_mutex_lock(pthread_mutex_t *mptr); 
int pthread_mutex_trylock(pthread_mutex_t *mptr); 
int pthread_mutex_unlock(pthread_mutex_t *mptr); 
均 返 回 : 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
如 采 答 试 给 一 个 已 由 另外 某 个 线程 锁 住 的 互 斥 锁 上 锁 ， 那 么 


pthread_mnutex_lock 将 阻塞 到 该 互 斥 锁 解 锁 为 止 。pthread_mnutex_trylock 
是 对 应 的 非 阻塞 函数 ， 如 果 该 互 斥 锁 已 锁 住 ， 它 就 返回 一 个 EBUSY 错 
误 。 

如 果 有 多 个 线程 阻塞 在 等 待 同 一 个 互 斥 锁 上 ， 那 么 当 该 互 斥 锁 解 锁 
时 ， 哪 一 个 线程 会 开始 运行 呢 ? 1003.1b-1993 标 准 增加 的 特性 之 一 是 提 
供 一 个 优先 级 调度 选项 。 我 们 不 讨论 该 领域 ， 不 过 下 述 概括 足以 说 明 其 
AA: 不 同 线程 可 被 赋予 不 同 的 优先 级 ， 同 步 函 数 《〈 互 斥 锁 、 读 写 锁 、 
aS) 将 唤醒 优先 级 最 高 的 被 阻塞 线程 。 [Butenhof 1997] 的 5.5 节 
提供 有 关 Posix.1 实 时 调度 特性 的 具体 细节 。 

尽管 我 们 说 互 斥 锁 保 护 的 是 临界 多， 实际 上 保护 的 是 在 临界 区 中 被 
操纵 的 数据 〈data) 。 也 就 是 说 ， 互 斥 锁 通 常用 于 保护 由 多 个 线程 或 多 
个 进程 分 享 的 共享 数据 (shared data) 。 

互 斥 锁 是 协作 性 (cooperative) 锁 。 这 束 是 说 ， 如 果 共 享 数 据 是 一 
个 链表 《〈 举 个 例子 ) ， 那 么 操纵 该 链表 的 所 有 线程 都 必须 在 实际 操纵 前 
获取 该 互 斥 锁 。 不 过 也 没有 办 法 防止 某 个 线程 不 首先 获取 该 互 斥 锁 就 操 
纵 访 链表。 





TA 消费 








同步 中 有 一 个 称 为 生产 者 一 消费 者 〈producer-consumer) 问题 的 经 
典 问题 ， 也 称 为 有 界 缓冲 区 (bounded buffer) 问题 。 一 个 或 多 个 生产 者 
《线程 或 进程 ) 创建 着 一 个 个 的 数据 条 目 ， 然 后 这 些 条 目 由 一 个 或 多 个 
消费 者 《线程 或 进程 ) 处 理 。 数 据 条 目 在 生产 者 和 消费 者 之 间 是 使 用 某 
种 类 型 的 IPC 传 递 的 。 

我 们 一 二 使 用 Unix 管 道 处 理 这 个 问题 。 这 束 古 说 ， 如 下 的 shell 管 道 
就 是 这 样 的 问题 : 


grep pattern chapters.* | wc -l 


grep 是 单个 生产 者 ，wc 是 单个 消费 者 。Unix 管 道 用 作 两 者 间 的 IPC 
形式 。 生 产 者 和 消费 者 间 所 需 的 同步 是 由 内 核 以 一 定 方式 处 理 的 ， 内 核 
以 这 种 方式 处 理 生产 者 的 write 和 消费 者 的 read。 如 果 生 产 者 超前 消费 者 
(也 就 是 管道 被 填 满 ) ， 内 核 就 在 生产 者 调用 write 时 把 它 投 入 睡眠 ， 直 
到 管道 中 有 衬 余 空间 。 如 果 消 费 者 超前 生产 者 〈 也 就 是 管道 为 空 ) ， 内 
核 就 在 消费 者 调用 read 时 把 它 投 入 睡眠 ， 直 到 管道 中 有 一 些 数据 为 止 。 

这 些 类 型 的 同步 是 隐 式 的 (implicit); 也 就 是 说 生产 者 和 消费 者 甚 
至 不 知道 内 核 在 执行 同步 。 如 果 我 们 改 用 Posix 消 息 队 列 或 System VH Is 
队列 作为 生产 者 和 消费 者 间 的 IPC 形 式 ， 那 么 内 核 仍 然 会 处 理 同 步 。 

然而 当 共 享 内 存 区 用 作 生 产 者 和 消费 者 之 间 的 IPC 形 式 时 ， 生 产 者 
和 消费 者 必须 执行 某 种 类 型 的 显 式 (explicit〉 同步 。 我 们 将 使 用 互 斥 锁 
展示 显 式 同步 。 图 7-1 展 示 了 我 们 使 用 的 例子 。 




















buff[0]: 

buff[1]: 

buff[2]: 
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buff [nitems-1]: 

















在 单个 进程 中 有 多 个 生产 者 线程 和 单个 消费 者 线程 。 整 数 数组 buff 
含有 被 生产 和 消费 的 条 目 〈 也 就 是 共享 数据 )〉 。 为 简单 起 见 ， 生 产 者 只 
征 把 buff[0] 设 置 为 0， 把 buff[1] 设 置 为 1， 如 此 等 等 。 消 费 者 只 是 治 着 该 
数组 行进 ， 并 验证 每 个 数组 元 又 都 是 正确 的 。 

在 第 一 个 例子 中 ， 我 们 只 关心 多 个 生产 者 线程 之 间 的 同步 。 直 到 所 











有 生产 者 线程 都 完成 工作 后 ， 我 们 才 局 动 消费 者 线程 。 图 7-2 是 这 个 例 
子 的 main 函 数 。 

线程 间 共 享 的 全 局 变量 

4 一 12 这 些 变量 是 各 个 线程 间 共 享 的 。 我 们 把 它们 以 及 相应 的 互 斤 
锁 收 集 到 一 个 名 为 shared 的 结构 中 ， 目 的 是 为 了 强调 这 些 变量 只 应 该 在 
拥有 其 互 斥 锁 时 访问 。nput 是 buff 数 组 中 下 一 次 存放 的 元 素 下 标 ，nval 是 
下 一 次 存放 的 值 (0、1、2 等 ) 。 我 们 分 配 这 个 结构 ， 并 初始 化 其 中 用 
于 生产 者 线程 间 同 步 的 互 斥 锁 。 

我 们 将 如 本 例子 所 做 的 那样 一 直 努 力 地 把 共享 数据 和 它们 的 同步 变 
= CARB APPS Se) 收集 到 一 个 结构 中 ， 这 是 一 个 很 好 的 
编程 技巧 。 然 而 在 许多 情况 下 共享 数据 是 动态 分 配 的 ， 壁 如 说 一 个 链 
表 。 我 们 可 以 把 该 链表 的 头 以 及 该 链表 的 同步 变量 存放 到 一 个 结构 中 
(图 5-20 中 的 mq_hdr 结 构 就 是 这 么 一 回 事 ) ， 但 是 其 他 共享 数据 (该 链 
表 的 其 余部 分 ) 却 不 在 该 结构 中 。 因 此 这 种 办 法 通常 是 不 完善 的 。 

命令 行 参数 

19~22 ”第 一 个 命令 行 参数 指定 生产 者 存放 的 条 目 数 ， 下 一 个 参数 
指定 竺 创建 生产 者 线程 的 数目 。 

设置 并 发 级 别 

23 我 们 的 set_concurrency 函 数 告诉 线程 系统 我 们 希望 并 发 运行 多 少 
线程 。 在 Solaris 2.6 下 ， 该 函数 只 是 调用 thr_setconcurrency， 当 我 们 希望 
多 个 生产 者 线程 中 每 一 个 都 有 执行 机 会 时 ， 这 个 函数 是 必需 的 。 如 果 我 
们 在 Solaris 下 省 略 该 调用 ， 那 么 只 有 第 一 个 生产 者 线程 运行 。 在 Digital 
Unix 4.0B 下 ， 我 们 的 Set_concurrency 国 数 不 做 任何 事 〈 因 为 默认 情况 
下 ， 一 个 进程 中 的 各 个 线程 竞争 使 用 处 理 器 〉。 

Unix ”98 需 要 一 个 名 为 pthread_setconcurrency 的 函数 执行 同样 的 功 
能 。 在 把 多 个 用 户 线程 (使 用 pthread_create 创 建 的 对 象 ) 复 用 到 较 小 的 
一 组 内 核 执行 实体 〈 例 如 内 核 线 程 ) 上 的 线程 实现 中 ， 该 函数 是 需要 




















的 。 这 些 实现 经 常 被 称 为 多 对 少 、 两 级 或 M 对 N 实 现 。 [butenhof 
1997] 的 5.6 节 详细 讨论 了 用 户 线程 和 内 核实 体 间 的 关系 。 





mutex/prodcons2.c 


1 #include "unpipc.h" 

2 #define MAXNITEMS 1000000 

3 #define MAXNTHREADS 100 

4 int nitems; /* read-only by producer and consumer */ 
5 struct { 

6 pthread_mutex_t mutex; 

ji int buff [MAXNITEMS] ; 

8 int nput ; 

9 int nval; 

10 } shared = { 

2d PTHREAD MUTEX INITIALIZER 

12 }; 

13 void *produce (void *), *consume(void *); 

14 int 

15 main(int argc, char **argv) 

16 ( 

E7 int i, nthreads, count [MAXNTHREADS] ; 

18 pthread t tid produce [MAXNTHREADS], tid consume; 
19 af (argo t= 3) 

20 err quit("usage: prodcons2 <#items> <#threads>") ; 
21 nitems - min(atoi(argv[1]), MAXNITEMS); 

22 nthreads - min(atoi(argv[2]), MAXNTHREADS); 

23 Set concurrency (nthreads) ; 

24 /* start all the producer threads */ 

25 for (i = 0; i « nthreads; i++) { 

26 count [i] = 0; 

27 Pthread_create(&tid_produce[i], NULL, produce, &count[i]); 
28 } 

29 /* wait for all the producer threads */ 

30 for (i = 0; i < nthreads; i++) { 

Ba Pthread_join(tid_produce [i], NULL); 

32 printf ("count [$d] = d\n", i, count [i]); 

33 } 

34 /* start, then wait for the consumer thread */ 
35 Pthread create(&tid consume, NULL, consume, NULL); 
36 Pthread join(tid consume, NULL); 

37 exit(0); 

38 } 


mutex/prodcons2.c 





图 7-2 main Zi 


创建 生产 者 线程 

24~28 ”创建 生产 者 线程 ， 每 个 线程 执行 produce。 在 tid_produce 数 
组 中 保存 每 个 线程 的 线程 ID。 传 递 给 每 个 生产 者 线程 的 参数 是 指 问 
count 数 组 中 某 个 元 素 的 指针 。 我 们 首先 把 该 计数 器 初始 化 为 0， 人 然后 每 





个 线程 在 每 次 往 缓冲 区 中 存放 一 个 条 目 时 给 这 个 计数 器 加 1。 当 一 切 生 
产 完毕 时 ， 我 们 输出 这 个 计数 器 数组 各 元 素 的 值 ， 以 查看 每 个 生产 者 线 
程 分 别 存放 了 多 少 条 目 

等 待 生产 者 线程 ， 然 后 启动 消费 者 线程 

29~36 等 待 所 有 生产 者 线程 终止 ， 同 时 输出 每 个 线程 的 计数 器 
值 ， 此 后 才 启 动 单 个 的 消费 者 线程 。 这 是 我 们 〈 和 暂时 ) 避免 生产 者 和 消 
费 者 之 间 的 同步 问题 的 办 法 。 接 着 等 待 消费 者 完成 ， 然 后 终止 进程 。 

图 7-3 给 出 了 这 个 例子 所 用 的 produce 和 consume 函 数 。 





mutex/prodcons2.c 





39 void * 

40 produce (void *arg) 

41 ( 

42 For if uw ow) ( 

43 Pthread mutex lock (&shared.mutex) ; 

44 if (shared. nput »- nitems) ( 

45 Pthread mutex unlock(&shared.mutex); 
46 return (NULL) ; /* array is full, we're done */ 
47 

48 shared.buff[shared.nput] = shared.nval; 
49 shared.nput4-*; 

50 shared.nval++; 

51 Pthread mutex unlock (&shared.mutex) ; 

52 *((int *) arg) += 1; 

53 } 

54 } 

55 void * 

56 consume (void *arg) 

ST 

58 int i; 

59 for (i = 0; i < nitems; i++) { 

60 if (shared.buff[i] != i) 

61 printf ("buff [%d] = $dWMn", i, shared.buff[il); 
62 

63 return (NULL) ; 

64 } 


mutex/prodcons2.c 





图 7-3 produce consume FK Zi 


产生 数据 条 日 

42~53 生产 者 的 临界 区 由 用 来 测试 是 否 一 切 生产 完毕 的 条 件 语 名 
if (shared.nput >= nitems) 

和 随后 的 三 行 

shared.buff[shared.nput] = shared.nval; 





shared.nput++; 

shared.nval++; 

构成 。 

我 们 用 一 个 互 斥 锁 保 护 该 临界 区 ， 同 时 保证 在 一 切 生产 完毕 的 情况 
下 给 该 互 斥 锁 解 锁 。 注 意 count 元 素 的 增加 《〈 通 过 指针 arg) 不 属于 该 临 
界 区 ， 因 为 每 个 线程 有 各 目的 计数 器 main 函数 中 的 count 数 组 ) . Bt 
然 如 此 ， 我 们 就 不 把 这 行 代码 包括 在 由 互 斥 锁 锁 住 的 临界 区 中 ， 因 为 作 
为 一 个 通用 的 编程 原则 ， 我 们 总 是 应 该 努力 减少 由 一 个 互 斥 锁 锁 住 的 代 
人 码 量 。 

消费 者 验证 数组 的 内 容 

59~62 消费 者 只 是 验证 buff 数 组 中 的 每 个 条 目 是 否 正 确 ， 知 发 现 错 
误 则 输出 一 个 消 有 息 。 正 如 我 们 先前 所 说 ， 本 函数 只 有 一 个 实例 在 运行 ， 
而 且 是 在 所 有 生产 者 线程 都 完成 之 后 ， 因 此 不 需要 任何 同步 。 

指定 一 百 万 个 条 目 和 5 个 生产 者 线程 运行 上 述 程序 ， 结 果 如 下 : 

solaris % prodcons2 10000005 

count[0] = 167165 

count[1] = 249891 

count[2] = 194221 

count[3] = 191815 

count[4] = 196908 

正如 我 们 所 提 ， 如 果 在 Solaris 2.6 下 去 掉 set_concurrency 调 用 ， 那 么 
count[0] 将 变 为 1000000， 其 余 计 数 器 则 都 是 0。 

要 是 我 们 删除 本 例子 中 的 互 斥 锁 上 锁 ， 那 么 它 将 如 期 地 失败 。 也 就 
古 说 ， 消 费 痢 将 检测 出 许多 buff[j] 不 等 于 i 的 情况。 我 们 还 可 以 验证 ， 如 
果 只 有 一 个 生产 者 线程 在 运行 ， 那 么 删除 互 斥 锁 上 锁 并 没有 影 啊 。 


7.4 对 比 上 锁 与 等 待 











现在 展示 互 斥 锁 用 于 上 锁 〈1locking) 而 不 能 用 于 等 街 
Cwaiting) 。 我 们 把 上 一 节 中 的 生产 者 -消费 者 例子 改 为 在 所 有 生产 者 
线程 都 启动 后 立即 启动 消费 者 线程 。 这 样 在 生产 者 线程 产生 数据 的 同 
时 ， 消 费 者 线程 束 能 处 理 它 ， 而 不 是 像 图 7-2 中 那样 ， 消 费 者 线程 直到 
所 有 生产 者 线程 都 完成 后 才 启 动 。 但 现在 我 们 必须 同步 生产 者 和 消费 
者 ， 以 确保 消费 者 只 处 理 已 由 生产 者 存放 的 数据 条 目 。 
图 7-4 给 出 了 main 函 数 。 在 main 声 明之 前 的 所 有 行 与 图 7-2 中 的 一 

















样 。 
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14 int 

15 main(int argc, char **argv) 

16 ( 

T7 int i, nthreads, count [MAXNTHREADS] ; 

18 pthread t tid produce[MAXNTHREADS], tid consume; 
19 if (argc l= 3) 

20 err quit("usage: prodcons3 <#items> <#threads>") ; 
21 nitems - min(atoi(argv[1]), MAXNITEMS); 

22 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 

23 /* create all producers and one consumer */ 

24 Set_concurrency (nthreads + 1); 

25 for (i = 0; i < nthreads; i++) { 

26 count [i] = 0; 

27 Pthread create(&tid produce[i], NULL, produce, &count [i]) ; 
28 } 

29 Pthread create(&tid consume, NULL, consume, NULL); 
30 /* wait for all producers and the consumer */ 
3d for (i = 0; i « nthreads; i++) { 

32 Pthread_join(tid_produce [i], NULL); 

33 printf ("count [td] = d\n", i, count [i]); 

34 

35 Pthread_join(tid_consume, NULL) ; 

36 exit (0); 

37 ) 
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图 7-4 main žit: 局 动 生产 者 后 立即 启动 消费 者 
24 给 并 发 级 别 加 1， 把 额外 的 消费 者 线程 也 计算 在 内 。 
25~29 创建 生产 者 线程 后 ， 立 即 创 建 消费 者 线程 。 
produce 函 数 没有 变化 ， 已 在 图 7-3 中 给 出 。 
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54 void 

55 consume wait(int i) 

56 { 

57 FOE ( FF) ft 

58 Pthread_mutex_lock (&shared.mutex) ; 

59 if (i < shared.nput) { 

60 Pthread_mutex_unlock (&shared.mutex) ; 
61 return; /* an item is ready */ 
62 } 

63 Pthread_mutex_unlock (&shared.mutex) ; 

64 } 

65 } 

66 void * 

67 consume (void *arg) 

68 ( 

69 int i; 

70 for (i = 0; i < nitems; i++) { 

71 consume_wait (i) ; 

72 if (shared.buff[i] != i) 

73 printf ("buff [%d] = %d\n", i, shared.buff[il); 
74 } 

75 return (NULL) ; 

76 } 
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图 7-5 consume_wait#llconsume F Jit 

消息 者 必须 等 待 

71 consume 函数 的 唯一 变动 是 在 从 buff 数 组 中 取出 下 一 个 条 目 之 前 
调用 consume_wait。 

等 待 生产 者 

57~64 ”我 们 的 consume_wait 函 数 必须 等 待 到 生产 者 产生 了 第 i 个 条 
目 。 为 检查 这 种 条 件 ， 先 给 生产 者 的 互 斥 锁 上 锁 ， 再 比较 ij 和 生产 者 的 
nput 下 标 。 我 们 必须 在 查看 nput 表 获得 互 斥 锁 ， 因 为 某 个 生产 者 线程 当 
时 可 能 正 处 于 更 新 该 变量 的 过 程 中 。 

这 里 的 基本 问题 是 : 当期 待 的 条 目 尚 未 准备 好 时 ， 我 们 能 做 些 什 
4? 图 7-5 中 的 做 法 是 一 次 次 地 循环 ， 每 次 给 互 斥 锁 解 锁 又 上 锁 。 这 称 








为 轮转 (spinning) 或 轮 询 (polling) ， 是 一 种 对 CPU 时 间 的 浪费 。 

我 们 也 许可 以 睡眠 很 短 的 一 段 时 间 ， 但 是 不 知道 该 睡眠 多 久 。 这 儿 
所 需 的 是 另 一 种 类 型 的 同步 ， 它 允许 一 个 线程 〈 或 进程 ) 睡眠 到 发 生 某 
个 事件 为 止 。 




















互 斥 锁 用 于 上 锁 ， 条 件 变量 则 用 于 等 待 。 这 两 种 不 同类 型 的 同步 都 
是 需要 的 。 


条 件 变 量 是 类 型 为 pthread_cond_t 的 变量 ， 以 下 两 个 函数 使 用 了 这 





#include <pthread.h> 

int pthread_cond_wait(pthread_cond_t *cptr,pthread_mutex_t *mptr); 

int pthread_cond_signal(pthread_cond_t *cptr); 

均 返 回 : 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 

其 中 第 二 个 函数 的 名 字 中 的 “signal” 一 词 指 的 不 是 Unix ” SIGxxx 信 
Fo 

这 两 个 函数 所 等 待 或 由 之 得 以 通知 的 “条 件 ”， 其 定义 由 我 们 选择 : 
我 们 在 代码 中 测试 这 种 条 件 。 

每 个 条 件 变 量 总 是 有 一 个 互 斥 锁 与 之 关联 。 我 们 调用 
pthread_cond_wait 等 待 某 个 条 件 为 真 时 ， 还 会 指定 其 条 件 变 量 的 地 址 和 
所 关联 的 互 斥 锁 的 地 址 。 

我 们 通过 重新 编写 上 一 市 中 的 例子 来 解释 条 件 变 量 的 使 用 。 图 7-6 
给 出 了 全 局 变量 的 声明 。 
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1 #include "unpipc.h" 

2 #define MAXNITEMS 1000000 

3 #define MAXNTHREADS 100 

4 /* globals shared by threads */ 

5 int nitems; /* read-only by producer and consumer */ 

6 int buff [MAXNITEMS] ; 

7 struct ( 

8 pthread mutex t mutex; 

9 int nput; /* next index to store */ 
10 int nval; /* next value to store */ 
11 ) put = { 
l2 PTHREAD MUTEX INITIALIZER 
13 E 


14 struct ( 


15 pthread mutex t mutex; 

16 pthread cond t cond; 

17 int nready; /* number ready for consumer */ 
18 ) nready - ( 

19 PTHREAD MUTEX INITIALIZER, PTHREAD COND INITIALIZER 

20 ); 
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图 7-6 使 用 条 件 变 量 的 生产 者 -消费 者 程序 全 局 变量 


把 生产 者 变量 和 互 斥 锁 收 集 到 一 个 结构 中 

7~13 把 互 斥 锁 变 量 mutex 以 及 与 之 关联 的 两 个 变量 nput 和 nval 收 集 
到 一 个 名 为 put 的 结构 中 。 生 产 者 使 用 这 个 结构 。 

把 计数 器 、 条 件 变量 和 互 斥 锁 收 集 到 一 个 结构 中 

14 一 20 下 一 个 结构 含有 一 个 计数 器 、 一 个 条 件 变量 和 一 个 互 斥 
锁 。 我 们 把 条 件 变 量 初始 化 为 PTHREAD_COND INITIALIZER. 

main 函 数 没 有 变动 ， 已 在 图 7-4 中 给 出 。 

Produce 和 consume 函 数 变 动 了 ， 在 图 7-7 中 给 出 。 

往 数 组 中 放置 下 一 个 条 目 

50—58 当 生 产 者 往 数组 buff 中 放置 一 个 新 条 目 时 ， 我 们 改 用 互 斥 锁 
put.mutex 来 为 临界 区 上 锁 。 
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46 void * 

47 produce (void *arg) 

48 ( 

49 £or' ( ; $9 

50 Pthread mutex lock(&put.mutex); 

51 if (put.nput »- nitems) ( 

52 Pthread_mutex_unlock (&put .mutex) ; 
53 return (NULL) ; /* array is full, we're done */ 
54 } 

55 buff [put.nput] = put.nval; 

56 put .nput++; 

57 put .nval++; 

58 Pthread mutex unlock (&put .mutex) ; 

59 Pthread mutex lock (&nready.mutex) ; 

60 if (nready.nready -- 0) 

61 Pthread cond signal (&nready.cond) ; 
62 nready .nready++; 

63 Pthread_mutex_unlock (&nready.mutex) ; 
64 *((int *) arg) += 1; 

65 } 

66 } 

67 void * 

68 consume (void *arg) 

69 ( 

70 int i; 

yak for (i = 0; i « nitems; i++) { 

72 Pthread mutex lock(&nready.mutex); 

73 while (nready.nready -- 0) 

74 Pthread cond wait(&nready.cond, &nready.mutex); 
75 nready.nready--; 

76 Pthread mutex unlock (&nready.mutex) ; 
77 if (buff[i] != i) 

78 printf ("buff[%d] = $àWMn", i, buff[il); 
79 } 

80 return (NULL) ; 

81 } 


mutex/prodcons6.c 





图 7-7 produce llconsume PK 2 
通知 消费 者 
59~64 给 用 来 统计 准备 好 由 消费 者 处 理 的 条 目 数 的 计数 器 
nready.nready 加 1。 在 加 1 之 前 ， 如 果 该 计数 器 的 值 为 0， 那 就 调用 
pthread_cond_signal 唤 醒 可 能 正在 等 待 其 值 变 为 非 零 的 任意 线程 〈《 如 消 
RA) 。 现 在 可 以 看 出 与 该 计数 器 关联 的 互 斥 锁 和 条 件 变量 的 相互 作 
用 。 该 计数 器 是 在 生产 者 和 消费 者 之 间 共 享 的 ， 因 此 只 有 锁 住 与 之 关联 


的 互 斥 锁 (Cnready.mutex) 时 才能 访问 它 。 与 之 关联 的 条 件 变量 则 用 于 
等 待 和 发 送信 号 。 

消费 者 等 待 nready.nready 变 为 非 零 

72~76 消费 者 只 是 等 待 计数 器 nready.nready 变 为 非 零 。 既 然 该 计数 
器 是 在 所 有 的 生产 者 和 消费 者 之 间 共 享 的 ， 那 么 只 有 锁 住 与 之 关联 的 互 
斥 锁 Cnready.mutex) 时 才能 测试 它 的 值 。 如 果 在 锁 住 该 互 斥 锁 期 间 访 
计数 器 的 值 为 0， 我 们 就 调用 pthread_cond_wait 进 入 睡眠 。 该 函数 原子 地 
执行 以 下 两 个 动作 : 

(128 HJF Sinready.mutexff- 8j; 

(2E HH AG ET A ETI, — ECRIRE P ALAS AK TE A tec 8] FH 
pthread cond signal. 

pthread_cond_wait 在 返回 前 重新 给 互 斥 锁 nready.mutex 上 锁 。 因 此 当 
它 返 回 并 且 我 们 发 现 计 数 器 nready.nready 不 为 0 时 ， 我 们 将 把 该 计数 器 减 
1《〈 前 提 是 我 们 肯定 已 锁 住 了 该 互 斥 锁 ) ， 然 后 给 该 互 斥 锁 解 锁 。 注 
意 ， 当 pthread_cond_wait 返 回 时 ， 我 们 总 是 再 次 测试 相应 条 件 成 立 与 
否 ， 因 为 可 能 发 生 虚 假 的 (spurious) 唤醒 : 期 待 的 条 件 尚 不 成 立时 的 
唤醒 。 各 种 线程 实现 都 试图 最 大 限度 减少 这 些 虚 假 唤醒 的 数量 ， 但 是 仍 

















有 可 能 发 生 。 
总 的 来 说 ， 给 条 件 变 量 发 送信 号 的 代码 大 体 如 下 : 
struct { 


pthread_mutex_t mutex; 

pthread_cond_t cond; 

维护 本 条 件 的 各 个 变量 
.va...PTHREAD_MUTEX_INITIALIZER,PIHREAD_COND_INITIAL 
Pthread_mutex_lock(&var.mutex); 
设置 条 件 为 真 


Pthread_cond_signal(&var.cond); 


Pthread_mutex_unlock(&var.mutex); 

在 我 们 的 例子 中 ， 用 来 维护 条 件 的 变量 是 一 个 整数 计数 器 ， 设 置 条 
件 的 操作 束 是 给 该 计数 器 加 1。 我 们 做 了 优化 处 理 ， 即 只 有 该 计数 占 从 0 
变 为 1 时 才 发 出 条 件 变量 信和 号 。 

测试 条 件 并 进入 睡眠 以 等 竺 该 条 件 变 为 真 的 代码 大 体 如 下 : 

Pthread_mutex_lock(&var.mutex); 

while (条 件 为 假 ) 

Pthread_cond_wait(&var.cond,&var.mutex); 

修改 条 件 

Pthread_mutex_unlock(&var.mutex); 

避免 上 锁 冲 突 

在 刚刚 给 出 的 代码 片段 以 及 图 7-7 中 ，pthread_cond_signal 由 当前 锁 
住 某 个 互 斥 锁 的 线程 调用 ， 而 该 互 斥 锁 是 与 本 函数 将 给 它 发 送信 号 的 条 
件 变 量 关 联 的 。 我 们 可 以 设想 下 最 坏 情 况 ， 当 该 条 件 变量 被 及 送信 和 号 
后 ， 系 统 立 即 调度 等 待 在 其 上 的 线程 ， 该 线程 开始 运行 ， 但 立即 俘 止 ， 
因为 它 没 能 获取 相应 的 互 斥 锁 。 为 避免 这 种 上 锁 冲 突 ， 图 7-7 中 的 代码 
可 作 如 下 变动 : 


int dosignal; 

















Pthread_mutex_lock(&nready.mutex); 

dosignal = (nready.nready == 0); 

nready.nready++; 

Pthread mutex unlock(&neready.mutex);if (dosignal) 

Pthread cond signal(&nready.cond); 

在 这 儿 ， 我 们 直到 释放 互 斥 锁 nready.mutex 后 才 给 与 之 关联 的 条 件 
变量 nready.cond 发 送信 号 。Posix 明 确 允 许 这 么 做 : 调用 
pthread_cond_signal 的 线程 不 必 是 与 之 关联 的 互 斥 锁 的 当前 属 主 。 不 过 
Posix 接 着 说 : 如 采 需 要 可 预见 的 调度 行为 ， 那 么 调用 





pthread_cond_signal 的 线程 必须 锁 住 该 互 斥 锁 。 














通 名 pthread_cond_signal 只 唤醒 等 竺 在 相应 条 件 变 量 上 的 一 个 线 
程 。 在 某 些 情况 下 一 个 线程 认定 有 多 个 其 他 线程 应 被 唤醒 ， 这 时 它 可 调 
用 pthread_cond_broadcast 唤 醒 阻 塞 在 相应 条 件 变量 上 的 所 有 线程 。 

有 多 个 线程 应 唤醒 的 情形 的 例子 之 一 发 生 在 我 们 将 在 第 8 章 中 讲述 
的 读 出 者 与 写 入 者 问题 中 。 当 一 个 写 入 者 完成 访问 并 释放 相应 的 锁 后 ， 
它 希 望 唤醒 所 有 排 着 队 的 读 出 者 ， 因 为 允许 同时 有 多 个 读 出 者 访问 。 

考虑 条 件 变 量 信号 单 播发 送 与 广播 发 送 的 一 种 候选 〈 且 更 为 安全 
的 ) 方式 是 坚持 使 用 广播 发 送 。 如 有 果 所 有 的 等 待 者 代码 都 编写 确切 ， 只 
有 一 个 等 待 者 需要 唤醒 ， 而 且 唤醒 哪 一 个 等 待 者 无 关 紧 要 ， 那 么 可 以 使 
用 为 这 些 情 况 而 优化 的 单 播发 送 。 所 有 其 他 情况 下 都 必须 使 用 广播 有 

#include <pthread.h> 








int pthread_cond_broadcast(pthread_cond_t *cptr); 
int pthread_cond_timedwait(pthread_cond_t — *cptr,pthread mutex t 
*mptr, 
const struct timespec *abstime); 
HRE: 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
pthread cond timedwait fù YT RFE SE EH. 3 EST EJ se Eb A BR ril 4B e 
abstime 参 数 是 一 个 timespec 结 构 : 
struct timespec { 
time t tv sec; /* seconds */ 
long tv nsec; /* nanoseconds */ 


上 


该 结构 指定 这 个 函数 必须 返回 时 的 系统 时 间 ， 即 便当 时 相应 的 条 件 
变量 还 没有 收 到 信和 号。 如 果 发 生 这 种 超时 情况 ， 该 函数 就 返回 
ETIMEDOUT 错 误 。 

时 间 值 是 绝对 时 间 Cabsolute time)〉， 而 不 是 时 间 差 (time 
delta〉。 这 就 是 说 ，abstime 是 该 函数 应 该 返回 时 刻 的 系统 时 间 一 一 自 
UTC 时 间 1970 年 1 月 1 日 子 时 以 来 流逝 的 秒 数 和 纳 秒 数 。 这 与 select、 
pselect 和 poll CUNPvI28638 ) 不 同 ， 它 们 都 指定 在 将 来 的 某 个 小 数秒 
数 ， 到 时 函数 应 该 返回 (select 指 定 将 来 的 微 秒 数 ，pselect 指 定 将 来 的 纳 
秒 数 ，poll 指 定 将 来 的 晤 秒 数 ) 。 使 用 绝对 时 间 而 不 是 时 间 差 的 好 处 
fe: 如 果 函 数 过 早 返回 了 《也 许 是 因为 捕获 了 某 个 信号 ) ， 那 么 同一 函 
数 无 需 改 变 其 参数 中 timespec 结 构 的 内 容 就 能 再 次 被 调用 。 











7.7 互 奈 锁 和 条 件 变 量 的 属性 


本 章 中 的 互 斥 锁 和 条 件 变量 例子 把 它们 作为 一 个 进程 中 的 全 局 变量 
和 存放， 它们 用 于 该 进程 内 各 线程 间 的 同步 。 我 们 用 两 个 常 值 
PTHREAD MUTEX INITIALIZERAIPTHREAD COND INITIALIZER 
来 初始 化 它们 。 由 这 种 方式 初始 化 的 互 斥 锁 和 条 件 变量 具备 默认 属性 ， 
不 过 我 们 还 能 以 非 默 认 属 性 初始 化 它们 。 

首先 ， 互 斥 锁 和 条 件 变量 是 用 以 下 函数 初始 化 或 摧毁 的 。 

#include <pthread.h> 

int pthread_mutex_init(pthread_mutex_t *mptr,const 
pthread_mutexattr_t *attr); 

int pthread_mutex_destroy(pthread_mutex_t *mptr); 

int pthread cond init(pthread cond t *cptr,const pthread condattr t 
*attr); 


int pthread cond, destroy(pthread cond t *cptr); 


均 返 回 : 大 成 功 则 为 0， 寿 出 错 则 为 正 的 Exxx 值 
考虑 互 斥 锁 情 况 ，mptr 必 须 指 同 一 个 已 分 配 的 pthread_mnutex_t 变 
量 ， 并 由 pthread_mnutex_init 函 数 初 始 化 该 互 斥 锁 。 由 该 函数 第 二 个 参数 
attr 指 问 的 pthread_mutexattr_t 值 指定 其 属性 。 如 果 该 参数 是 个 空 指针 ， 
那 束 使 用 默认 属性 。 
互 斥 锁 属性 的 数据 类 型 为 pthread_mutexattr t， 条 件 变量 属性 的 数据 
类 型 为 pthread_condattr_ t， 它 们 由 以 下 函数 初始 化 或 摧毁 
#include <pthread.h> 
int pthread_mutexattr_init(pthread_mutexattr_t *attr); 
int pthread_mutexattr_destroy(pthread_mutexattr_t *attr); 
int pthread_condattr_init(pthread_condattr_t *attr); 
int pthread_condattr_destroy(pthread_condattr_t *attr); 
MR: 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
一 且 茶 个 互 斥 锁 属 性 对 象 或 东 个 条 件 变量 属性 对 象 已 被 初始 化 ， 束 
通过 调用 不 同 函 数 启用 或 禁止 特定 的 属性 。 举 例 来 说 ， 我 们 将 在 以 后 各 
章 中 使 用 的 一 个 属性 是 : 指定 互 斥 锁 或 条 件 变量 在 不 同 进程 间 共 享 ， 而 
不 是 只 在 单个 进程 内 的 不 同 线程 间 共享 。 这 个 属性 是 用 以 下 函数 取得 或 
存 入 的 。 
#include <pthread.h> 

















int pthread mutexattr getpshared(const pthread_mutexattr_t *attr,int 
*valptr); 

int pthread mutexattr setpshared(pthread mutexattr t *attr,int value); 

int pthread condattr getpshared(const ^ pthread condattr t — *attr,int 
*valptr); 

int pthread  condattr setpshared(pthread condattr t *attr,int value); 

均 返 回 : 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
其 中 两 个 get 函 数 返 回 在 由 valptr 指 向 的 整数 中 的 这 个 属性 的 当前 


值 ， 两 个 set 函 数 则 根据 value 的 值 设置 这 个 属性 的 当前 值 。value 的 值 可 
以 是 PTHREAD_PROCESS_PRIVATE 或 
PTHREAD_PROCESS_SHARED。 后 者 也 称 为 进程 间 共 享 属性 。 

这 个 特性 只 在 头 文件 <unistd.h> 中 定义 了 常 值 
_POSIX_THREAD_PROCESS_SHARED 时 才 得 以 支持 。 它 在 Posix.1 中 
是 可 选 特性 ， 在 Unix 98 中 却 是 必需 的 〈 图 1-5) 。 

以 下 代码 片段 给 出 初始 化 一 个 互 斥 锁 以 便 它 能 在 进程 间 共 享 的 过 


fE: 
pthread_mutex_t *mptr; /* pointer to the mutex in shared 
memory */ 
pthread_mutexattr_t mattr; /* mutex attribute datatype */ 
mptr = /* some value that points to shared memory */ 


;Pthread_mutexattr_init(&mattr); 
#ifdef POSIX THREAD PROCESS SHARED 
Pthread mutexattr setpshared(&mattr,PTHREAD PROCESS SHAR 


#else 

# error this implementation does not support 
_POSIX_THREAD_PROCESS_SHARED 

#endif 


Pthread mutex init(mptr,&mattr); 
我 们 声明 一 个 名 为 mattr 的 pthread_mnutexattr_t 数 据 类 型 的 变量 ， 把 
它 初 始 化 成 互 斥 锁 的 默认 属性 ， 然 后 给 EE 
PTHREAD PROCESS SHARED 属 性 意思 是 该 互 斥 锁 将 在 进程 间 共 
享 。pthread_mnutex_init 然 后 照 此 初始 E 互 斥 锁 。 必 须 分 配给 该 互 斥 锁 
的 共享 内 存 区 空间 大 小 为 sizeof(pthread_mutex_t)。 
用 于 给 存放 在 共享 内 存 区 中 供 多 个 进程 使 用 的 一 个 条 件 变 量 设 置 





PTHREAD_PROCESS_SHARED 属 性 的 一 组 语句 跟 用 于 互 斥 锁 的 语句 几 
乎 相同 ， 只 需 把 其 中 的 5 处 mutex 替 换 成 cond。 
我 们 已 在 图 5-22 中 给 出 这 些 进 程 间 共 享 的 互 斥 锁 和 条 件 变量 的 例 





了 
持 有 锁 期 间 进 程 终 目 

当 在 进程 间 共 享 一 个 互 斥 锁 时 ， 持 有 该 互 斥 锁 的 进程 在 持 有 期 间 终 
止 (也许 是 非 自愿 地 〉 的 可 能 总 是 有 的 。 没 有 办 法 让 系统 在 进程 终止 时 
自动 释放 所 持 有 的 锁 。 我 们 将 会 看 到 读 写 锁 和 Posix 信 和 号 量 也 有 具备 这 种 
属性 。 进 程 终 止 时 内 核 总 是 自动 清理 的 唯一 同步 锁 类 型 是 fcntl 记 录 锁 
(第 9 章 ) 。 使 用 System V 信 号 量 时 ， 应 用 程序 可 以 选择 进程 终止 时 内 
核 是 否 自动 清理 某 个 信号 量 锁 〈 将 在 11.3 节 中 讨论 的 SEM_UNDQ 特 
性 ) 。 

一 个 线程 也 可 以 在 持 有 某 个 互 斥 锁 期 间 终 止 ， 起 因 是 被 另 一 个 线程 
取消 或 自己 去 调用 了 pthread_exit。 后 者 没什么 可 关注 的 ， 因 为 如 果 访 线 
程 调 用 pthread_exit 目 愿 终 止 的 话 ， 它 应 该 知道 目 己 还 持 有 一 个 互 斥 锁 。 
如 果 是 被 另 一 个 线程 取消 的 情况 ， 那 么 该 线程 可 以 安装 将 在 被 取消 时 调 
用 的 清理 处 理 程序 ， 如 8.5 节 中 所 展示 的 那样 。 对 于 一 个 线程 来 说 是 致 
命 的 条 件 通常 还 导致 整个 进程 的 终止 。 举 例 来 说 ， 如 果 某 个 线程 执行 了 
一 个 无 效 指针 访问 ， 从 而 引发 了 SIGSEGV 信 号 ， 那 么 一 旦 该 信号 未 被 
捕获 ， 整 个 进程 就 被 它 终止 ， 我 们 于 是 回 到 了 先前 处 理 进 程 终 止 的 条 件 
ies 

即使 一 个 进程 终止 时 系统 会 自动 释放 某 个 锁 ， 那 也 可 能 解决 不 了 问 
题 。 该 锁 保 护 某 个 临界 区 很 可 能 是 为 了 在 执行 该 临界 区 代码 期 间 更 新 某 
个 数据 。 如 果 该 进程 在 执行 该 临界 区 的 中 途 终 止 ， 该 数据 处 于 什么 状态 
We? 该 数据 处 于 不 一 致 状态 的 可 能 性 很 大 : 举例 来 说 ， 一 个 新 条 目 也 许 
只 是 部 分 插入 某 个 链表 中 ， 要 是 该 进程 终止 时 内 核 仅 仅 把 那个 锁 解 开 的 
话 ， 使 用 该 链表 的 下 一 个 进程 就 可 能 发 现 它 已 损坏 。 























然而 在 茶 些 例子 中 ， 让 内 核 在 进程 终止 时 清理 东 个 锁 《〈 知 是 信号 量 
情况 则 为 计数 器 ) 不 成 问题 。 例 如 ， 末 个 服务 器 可 能 使 用 一 个 System V 
信号 量 打开 其 SEM_UNDO 特 性 ) 来 统计 当前 被 处 理 的 客户 数 。 每 次 
fork 一 个 子 进程 时 ， 它 就 把 该 信号 量 加 1， 当 该 子 进程 终止 时 ， 它 再 把 该 
信号 量 减 1。 如 果 该 子 进程 非 正 常 终止 ， 内 核 仍 会 把 该 计数 器 减 1。9.7 
节 给 出 了 一 个 例子 ， 说 明 内 核 在 什么 时 候 释放 一 个 锁 〈 不 是 我 们 刚 讲 的 
计数 器 ) 合适 。 那 儿 的 守护 进程 一 开始 就 在 自己 的 茶 个 数据 文件 上 获得 
一 个 写 入 锁 ， 然 后 在 其 运行 期 间 一 直 持 有 该 锁 。 如 果 有 人 试图 启动 该 守 
护 进 程 的 男 一 个 副本 ， 那 么 新 的 副本 将 因为 无 法 取得 该 写 入 锁 而 终止 ， 
从 而 确保 该 守护 进程 只 有 一 个 副本 在 一 直 运 行 。 但 是 如 果 该 守护 进程 不 
正常 地 终止 了 ， 那 么 内 核 会 释放 该 写 入 锁 ， 从 而 允许 局 动 该 守护 进程 的 
为 一 个 副本 。 











7 了 短小 结 


互 斥 锁 用 于 保护 代码 临界 区 ， 从 而 保证 任何 时 刻 只 有 一 个 线程 在 临 
界 区 内 执行 。 有 时 候 一 个 线程 获得 某 个 互 斥 锁 后 ， 发 现 自己 需要 等 待 某 
个 条 件 变 为 真 。 如 果 是 这 样 ， 该 线程 束 可 以 等 竺 在 某 个 条 件 变 量 上 。 条 
件 变量 总 是 有 一 个 互 斥 锁 与 之 关联 。 把 调用 线程 投入 睡眠 的 
pthread_cond_wait 函 数 在 这 么 做 之 前 先 给 所 关联 的 互 斥 锁 解 锁 ， 以 后 某 
个 时 刻 唤醒 该 线程 前 再 给 该 互 斥 锁 上 锁 。 该 条 件 变量 由 另外 某 个 线程 回 
它 发 送信 号 ， 而 这 个 发 送信 号 的 线程 既 可 以 只 唤醒 一 个 线程 
(pthread cond signaD ， 也 可 以 唤醒 等 待 相应 条 件 变 为 真 的 所 有 线程 
(pthread cond broadcast) . 

互 斥 锁 和 条 件 变量 可 以 静态 分 配 并 静态 初始 化 。 它 们 也 可 以 动态 分 
配 ， 那 要 求 动态 地 初始 化 它们 。 动 态 初始 化 允许 我 们 指定 进程 间 共 享 属 
性 ， 从 而 允许 在 不 同 进程 间 共 享 某 个 互 斥 锁 或 条 件 变 量 ， 其 前 提 是 该 互 














斥 锁 或 条 件 变 量 必须 存放 在 由 这 些 进程 共享 的 内 存 区 中 。 
习题 


7.1 去 挤 几 7-3 中 的 互 斥 锁 ， 验 证 这 个 例子 在 运行 不 止 一 个 生产 者 线 
程 的 前 提 下 会 失败 。 

7.2 如 果 把 图 7-2 中 对 消费 者 线程 的 Pthread_join 调 用 去 掉 ， 那 么 会 发 
EITA? 

7.8 编写 一 个 程序 ， 在 一 个 无 限 循 环 中 只 调用 pthread_mnutexattr_init 
和 pthread_condattr_init。 使 用 诸如 ps 这 样 的 程序 观察 其 进程 的 内 存 使 用 
情况 。 发 生 了 什么 ?现在 加 上 合适 的 pthread_mutexattr_destroy 和 
phtread_condattr_destory， 再 验证 没有 发 生 内 存 遗 漏 。 

7.4 在 图 7-7 中 ， 生 产 者 只 在 计数 器 nready.nready 由 0 变 为 1 时 才 调 用 
pthread_cond_signal。 为 但 看 这 种 优化 处 理 的 效果 ， 增 设 一 个 计数 器 ， 
它 在 每 次 调用 pthread_cond_signal 时 加 1， 当 消费 者 完成 时 ， 在 主线 程 中 
输出 这 个 计数 器 的 值 。 
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8.1 概述 


互 斥 锁 把 试图 进入 我 们 称 之 为 临界 区 的 所 有 其 他 线程 都 阻塞 住 。 访 
临界 区 通常 涉及 对 由 这 些 线程 共享 的 一 个 或 多 个 数据 的 访问 或 更 新 。 然 
而 有 时 候 我 们 可 以 在 读 某 个 数据 与 修改 某 个 数据 之 间作 区 分 。 

我 们 现在 讲述 读 写 锁 (read-write lock) ， 并 在 获取 读 写 锁 用 于 读 和 
获取 读 写 锁 用 于 写 之 间作 区 分 。 这 些 读 写 锁 的 分 配 规则 如 下 : 

() 只 要 没有 线程 持 有 某 个 给 定 的 读 写 锁 用 于 写 ， 那 么 任意 数目 的 线 
程 可 以 持 有 该 读 写 锁 用 于 读 。 

(2) 仅 当 没 有 线程 特有 某 个 给 定 的 读 写 锁 用 于 读 或 用 于 与 时 ， 才 能 分 
配 该 读 写 锁 用 于 写 。 

换 一 种 说 法 就 是 ， 只 要 没有 线程 在 修改 某 个 给 定 的 数据 ， 那 么 任意 
数目 的 线程 都 可 以 拥有 该 数据 的 恋 访 问 权 。 仅 当 没 有 其 他 线程 在 读 或 修 
改 某 个 给 定 的 数据 时 ， 当 前 线程 才 可 以 修改 它 。 

某 些 应 用 中 读数 据 比 修改 数据 频繁 ， 这 些 应 用 可 从 改 用 读 写 锁 代 葵 
互 奈 锁 中 获 益 。 任 意 给 定时 刻 允 许多 个 读 出 者 存在 提供 了 更 高 的 并 发 
度 ， 同 时 在 某 个 写 入 者 修改 数据 期 间 保 护 该 数据 ， 以 免 任 何其 他 读 出 者 
或 号 入 者 的 干扰 。 

这 种 对 于 茶 个 给 定 资 源 的 共享 访问 也 称 为 共享 一 独占 (shared- 
exclusive) 上 锁 ， 因 为 获取 一 个 读 写 锁 用 于 读 称 为 共享 锁 (shared 
lock) ， 获 取 一 个 读 写 锁 用 于 写 称 为 独占 锁 Cexclusive lock) 。 有 关 这 
种 类 型 问题 〈 多 个 读 出 者 和 一 个 写 入 者 ) 的 其 他 说 法 有 读 出 者 与 写 入 者 

(readers and writers) 问题 以 及 多 读 出 者 一 单 写 入 者 Creaders-writer) 














锁 。“〈 最 后 一 个 说 法 的 英文 名 称 中 , "readers Exe E XI, "writer" f Xx 
是 单数 ， 目 的 是 强调 这 种 问题 的 多 个 读 出 者 与 单个 写 入 者 本 性 。) 

读 写 锁 的 一 个 日 常 类 比 是 访问 银行 账户 。 多 个 线程 可 以 同时 读 出 某 
个 账户 的 收文 结余 ， 但 是 一 旦 有 一 个 线程 需要 更 新 某 个 给 定 收文 结余 ， 
该 线程 就 必须 等 待 所 有 读 出 者 完成 该 收 支 结 余 的 读 出 ， 然 后 只 允许 该 更 
新 线程 修改 这 个 收文 结余 。 直 到 更 新 完 之 前 ， 任 何 读 出 者 都 不 允许 读 该 
收 支 结余 。 

本 章 中 描述 的 函数 由 Unix 98 定 义 ， 因 为 读 写 锁 不 属于 1996 年 
Posix.1 标 准 的 一 部 分 。 这 些 函 数 是 在 1995 年 由 一 个 称 为 Aspen ”Group 的 
Unix 三 家 联合 体 开 发 的 ， 同 时 开发 的 还 有 Posix.1 未 定义 的 其 他 扩充 。 有 
一 个 Posix 工 作 组 《1003.1j ) 正在 开发 包括 读 写 锁 在 内 的 一 组 Pthread 扩 
充 ， 它 们 很 有 可 能 与 本 章 中 讲述 的 一 样 。 








读 写 锁 的 数据 类 型 为 pthread_rwlock_t。 如 果 这 个 类 型 的 某 个 变量 是 
静态 分 配 的 ， 那 么 可 通过 给 它 赋 常 值 
PTHREAD_RWLOCK_INITIALIZER 来 初始 化 它 。 

pthread_rwlock_rdlock 获 取 一 个 读 出 锁 ， 如 果 对 应 的 读 写 锁 已 由 某 
个 写 入 者 持 有 ， 那 就 阻塞 调用 线程 。pthread_rwlock_wrlock 获 取 一 个 写 
入 锁 ， 如 采 对 应 的 读 写 锁 已 由 另 一 个 写 入 者 持 有 ， 或 者 已 由 一 个 或 多 个 
读 出 者 持 有 ， 那 就 阻塞 调用 线程 。pthread_rwlock_unlock 释 放 一 个 读 出 
锁 或 写 入 锁 。 

#include <pthread.h> 

int pthread_rwlock_rdlock(pthread_rwlock_t *rwptr); 

int pthread_rwlock_wrlock(pthread_rwlock_t *rwptr); 


int pthread_rwlock_unlock(pthread_rwlock_t *rwptr); 


ARI: 大 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
下 面 两 个 函数 党 试 获取 一 个 读 出 锁 或 写 入 锁 ， 但 是 如 果 该 锁 不 能 马 
上 取得 ， 那 就 返回 一 个 EBUSY 错 误 ， 而 不 是 把 调用 线程 投入 睡眠 。 
#include <pthread.h> 
int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwptr); 
int pthread_rwlock_trywrlock(pthread_rwlock_t *rwptr); 
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我 们 提 到 过 ， 可 通过 给 一 个 静态 分 配 的 读 写 锁 赋 常 值 
PTHREAD_RWLOCK_INITIALIZER 来 初始 化 它 。 读 写 锁 变量 也 可 以 通 
过 调用 pthread_rwlock_init 来 动态 地 初始 化 。 当 一 个 线程 不 再 需要 某 个 读 
写 锁 时 ， 可 以 调用 pthread_rwlock_destroy 摧 毁 它 。 

#include <pthread.h> 

int pthread_rwlock_init(pthread_rwlock_t *rwptr, 

const pthread_rwlockattr_t *attr); 
int pthread_rwlock_destroy(pthread_rwlock_t *rwptr); 
MR: 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
初始 化 某 个 读 写 锁 时 ， 如 果 attr 是 个 空 指针 ， 那 就 使 用 默认 属性 。 
要 赋予 它 非 默认 的 属性 ， 需 使 用 下 面 两 个 函数 。 
#include <pthread.h> 








int pthread_rwlockattr_init(pthread_rwlockattr_t *attr); 
int pthread_rwlockattr_destroy(pthread_rwlockattr_t *attr); 
均 返 回 : 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 
数据 类 型 为 pthread_rwlockattr_t 的 某 个 属性 对 象 一 旦 初始 化 ， 束 通 
过 调用 不 同 的 函数 来 局 用 或 禁止 特定 属性 。 当 前 定义 了 的 唯一 属性 是 





PTHREAD_PROCESS_SHARED， 它 指定 相应 的 读 写 锁 将 在 不 同 进程 间 
共享 ， 而 不 仅仅 是 在 单个 进程 内 的 不 同 线程 间 共 享 。 以 下 两 个 函数 分 别 
获取 和 设置 这 个 属性 。 

#include <pthread.h> 





int pthread_rwlockattr_getpshared(const pthread_rwlockattr_t *attr,int 
*valptr); 

int pthread_rwlockattr_setpshared(pthread_rwlockattr_t *attr,int value); 

均 返 回 : 知 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 

第 一 个 函数 在 由 valptr 指 问 的 整数 中 返回 该 属性 的 当前 值 。 第 二 个 
函数 把 该 属性 的 当前 值 设 置 为 value， 其 值 或 为 
PTHREAD_PROCESS_PRIVATE， 或 为 
PTHREAD_PROCESS_SHARED. 
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种 可 能 的 实现 。 这 个 实现 优先 考虑 等 待 着 的 写 入 者 。 这 不 是 必需 的 ， 可 
以 有 其 他 实现 方案 。 

本 节 和 本 章 剩 余 各 节 含 有 高 级 主题 ， 第 一 次 阅读 时 你 可 和 暂时 跳 过 

读 写 锁 的 其 他 实现 也 值得 研究 。 [Butenhof 1997] 的 7.1.2 节 提供 了 
一 个 优先 考虑 等 待 着 的 读 出 者 的 实现 ， 并 且 包 括 取消 处 理 〈 我 们 将 稍 后 
讨论 ) 。 [IEEE1996] 的 B.18.2.3.1 节 提供 了 另 一 个 优先 考虑 等 待 着 的 
写 入 者 的 实现 ， 也 包括 取消 处 理 。 [Kleiman,Shah,and Smaalders 1996 | 
第 14 章 提供 了 一 个 优先 考虑 等 待 着 的 写 入 者 的 实现 。 本 节 给 出 的 实现 来 
自 Doug Schmidt 的 ACE 软件 包 http: //www.cs.wustl.edu/~ 
schmidt/ACE.html (适应 性 通信 环境 ，Adaptive Communications 














Environment) 。 以 上 4 个 实现 都 使 用 互 斥 锁 和 条 件 变量 。 

8.4.1 pthread_rwlock_t 数 据 类 型 

图 8-1 给 出 我 们 的 pthread_rwlock.h 头 文件 ， 它 定义 了 基本 的 
pthread_rwlock_t 数 据 类 型 和 操作 读 写 锁 的 各 个 函数 的 函数 原型 。 通 钟情 
况 下 它们 是 在 <pthread.h> 头 文件 中 。 


my_rwlock/pthread_rwlock.h 





m 


Hifndef ^X pthread rwlock h 


2 #define  pthread rwlock h 

3 typedef struct { 

4 pthread_mutex_t rw_mutex; /* basic lock on this struct */ 

5 pthread_cond_t rw_condreaders; /* for reader threads waiting */ 
6 pthread_cond_t rw_condwriters; /* for writer threads waiting */ 
7 int rw magic; /* for error checking */ 

8 int rw nwaitreaders; /* the number waiting */ 

9 int rw nwaitwriters; /* the number waiting */ 

10 int rw refcount; 

AER /* -1 if writer has the lock, else # readers holding the lock */ 


12 } pthread rwlock t; 


13 #define RW MAGIC 0x19283746 


14 /* following must have same order as elements in struct above */ 
15 #define PTHREAD RWLOCK_INITIALIZER { PTHREAD MUTEX INITIALIZER, \ 

16 PTHREAD COND INITIALIZER, PTHREAD COND INITIALIZER, N 

17 RW MAGIC, 0, 0, 0 } 

18 typedef int pthread rwlockattr t; /* dummy; not supported */ 

19 /* function prototypes */ 





图 8-1 pthread rwlock t 数 据 类 型 的 定义 





20 int pthread rwlock destroy (pthread_rwlock_t *); 

21. int pthread rwlock init(pthread rwlock t *, pthread rwlockattr t *); 
22 int pthread rwlock rdlock(pthread rwlock t *); 

23. int pthread rwlock tryrdlock(pthread rwlock t *); 

24 int pthread rwlock trywrlock(pthread rwlock t *); 

25 int pthread rwlock unlock(pthread rwlock t *); 

26 int pthread rwlock wrlock(pthread rwlock t *); 

27 /* and our wrapper functions */ 


28 void Pthread rwlock destroy(pthread rwlock t *); 

29 void Pthread rwlock init(pthread rwlock t *, pthread rwlockattr t *); 
30 void Pthread rwlock rdlock(pthread rwlock t *); 

32. int Pthread rwlock tryrdlock(pthread rwlock t *); 

32 ant Pthread rwlock trywrlock(pthread rwlock t *); 

33 void Pthread rwlock unlock(pthread rwlock t *); 

34 void Pthread rwlock wrlock(pthread rwlock t *); 


35 #endif /* _ pthread rwlock h */ 
my rwlock/pthread rwlock.h 


图 8-1 CHE) 


3—13 我 们 的 pthread_rwlock t 数 据 类 型 含有 一 个 互 斥 锁 、 两 个 条 件 

TA 一 个 标志 及 三 个 计数 器 。 我 们 将 从 接 下 来 给 出 的 函数 中 看 出 所 有 
这 些 成 员 的 用 途 。 无 论 何 时 检查 或 操纵 该 结构 ， 我 们 都 必须 持 有 其 中 的 

互 斥 锁 成 员 rw_mutex。 该 结构 初始 化 成 功 后 ， 标 志 成 员 rw_magic 就 被 设 
置 成 RW_MAGIC。 所 有 函数 都 测试 该 成 员 ， 以 检查 调用 者 是 否 向 某 个 
已 初始 化 的 读 写 锁 传 递 了 指针 。 该 读 写 锁 被 摧毁 时 ， 这 个 成 员 就 被 置 为 
0。 

注意 计数 器 成 员 之 一 rw_refcount 总 是 指示 着 本 读 写 锁 的 当前 状 
态 : -1 表示 和 它 是 一 个 写 入 锁 《〈 任 意 时 刻 这 样 的 锁 只 能 有 一 个 ) ，0 表 示 
它 是 可 用 的 ， 大 于 0 的 值 则 意味 着 它 当 前 容纳 着 那么 多 的 读 出 锁 。 

14 一 17 给 该 数据 类 型 定义 静态 初始 化 常 值 。 

8.4.2 pthread_rwlock_ na Zu 



































图 8-2 给 出 了 我 们 的 第 一 个 函数 pthread_rwlock_init， 它 动态 初始 化 
一 个 读 写 锁 。 
my_rwlock/pthread_rwlock_init.c 
1 #include "unpipc.h" 
2 #include "pthread rwlock.h" 
3 int 


4 pthread rwlock init(pthread rwlock t *rw, pthread rwlockattr t *attr) 


5 { 


6 int result; 

jh if (attr !- NULL) 

8 return(EINVAL); /* not supported */ 

9 if ( (result = pthread mutex init(&rw-»rw mutex, NULL)) != 0) 

10 goto errl; 

TT if ( (result = pthread cond init(&rw-»rw condreaders, NULL)) != 0) 
12 goto err2; 

13 if ( (result = pthread cond init(&rw-»rw condwriters, NULL)) !- 0) 
14 goto err3; 

15 rw-»rw nwaitreaders - 0; 





图 8-2 pthread rwlock init Zi: 初始 化 一 个 读 写 锁 





16 rw-»rw nwaitwriters = 0; 


LT rw-»rw refcount = 0; 

18 rw-»rw magic - RW MAGIC; 

19 return (0) ; 

20 err3: 

21 pthread cond destroy(&rw-»rw condreaders); 
22 err2: 

23 pthread mutex destroy(&rw-»rw mutex); 

24 erri: 

25 return (result) ; /* an errno value */ 
26 } 





my rwlock/pthread rwlock initie 
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7~8 我 们 不 文 持 使 用 本 函数 给 恋 写 锁 赋 属性 ， 因 此 检查 其 attr 是 人 否 
> EIS 

9—19 初始 化 由 调用 者 指定 其 指针 的 读 写 锁 结 构 中 的 互 斥 锁 和 两 个 
条 件 变 量 成 员 。 所 有 三 个 计数 器 成 员 都 设置 为 0，rw_magic 成 员 则 设置 
为 表示 该 结构 已 初始 化 完毕 的 值 。 

20—25 ”如 果 互 帮 锁 或 条 件 变 量 的 初始 化 失败 ， 那 么 小 心地 确保 挫 
毁 已 初始 化 的 对 象 ， 然 后 返回 一 个 错误 。 

8.4.3 pthread_rwlock_destroy 函 数 

图 8-3 给 出 了 我 们 的 pthread_rwlock_destroy 函 数 ， 它 在 所 有 线程 〈 包 
括 调用 者 在 内 ) 都 不 再 持 有 也 不 试图 持 有 某 个 读 写 锁 的 时 候 挫 毁 该 锁 。 
8 一 13 前 先 检查 由 调用 者 指定 的 读 写 锁 已 不 在 使 用 中 ， 然 后 给 其 中 的 互 
斥 锁 和 两 个 条 件 变 量 成 员 调 用 合适 的 摧毁 函数 。 








1 #include "unpipc.h" 


my rwlock/pthread rwlock destroy.c 


2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock destroy(pthread rwlock t *rw) 

5 { 

6 if (rw-»rw magic !- RW MAGIC) 

7 return (EINVAL) ; 

8 if (rw->rw_refcount != 0 || 

9 rw-»rw nwaitreaders != 0 || rw-»rw nwaitwriters != 0) 
10 return (EBUSY) ; 

i pthread mutex destroy(&rw-»rw mutex); 

12 pthread cond destroy(&rw-»rw condreaders); 
13 pthread cond destroy(&rw-»rw condwriters); 
14 rw-»rw magic = 0; 

ES return (0); 


16 } 


—— my _rwlock/pthread_rwlock_destroy.c 


图 8-3 pthread_rwlock_destroy 函 数 : 摧毁 一 个 读 写 锁 


8.4.4 pthread rwlock rdlock;& Zi 
图 8-4 给 出 了 我 们 的 pthread_rwlock_rdlock 函 数 。 


my_rwlock/pthread_rwlock_rdlock.c 





1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock rdlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) !- 0) 
10 return (result); 

TIT /* give preference to waiting writers */ 

12 while (rw-»rw refcount < 0 || rw-»rw nwaitwriters > 0) ( 
13 rw->rw_nwaitreaders++; 

14 result = pthread cond wait(&rw-»rw condreaders, &rw-»rw mutex); 
15 rw-»rw nwaitreaders--; 

16 LE (result: i= (0) 

17 break; 

18 } 

19 if (result == 0) 

20 rw->rw_refcount++; /* another reader has a read lock */ 
21 pthread_mutex_unlock (&rw->rw_mutex) ; 

22 return (result) ; 

23 7 


my rwlock/pthread rwlock rdlock.c 


图 8-4 pthread_rwlock_rdlockeA Zi: 获取 一 个 读 出 锁 


9—10 无 论 何 时 操作 pthread_rwlock_t 类 型 的 结构 ， 都 必须 给 其 中 的 
rw_mutex 成 员 上 锁 。 

11—18 WR (a) rw_refcount 小 于 0 (意味 着 当前 有 一 个 写 入 者 持 有 
由 调用 者 指定 的 读 写 锁 ) ， 或 者 Cb) 有 线程 正 等 着 获取 该 读 写 锁 的 一 
个 写 入 锁 (rw_nwaitwriters 大 于 0) ， 那 么 我 们 无 法 获取 该 读 写 锁 的 一 个 
读 出 锁 。 如 果 这 两 个 条 件 中 有 一 个 为 真 ， 我 们 就 把 rw_nwaitreaders 加 1。 
并 在 rw_condreaders 条 件 变量 上 调用 pthread_cond_wait。 我 们 稍 后 将 看 
到 ， 当 给 一 个 读 写 锁 解 锁 时 ， 首 先 检 查 是 否 有 任何 等 待 着 的 写 入 者 ， 寿 
没有 则 检查 是 否 有 任何 等 待 着 的 读 出 者 。 如 果 有 读 出 者 在 等 待 ， 那 就 问 
rw_condreaders 条 件 变量 广播 信号 。 

19~20 取得 读 出 锁 后 把 rw_refcount 加 1。 互 斥 锁 旋即 释放 。 

该 函数 中 存在 一 个 问题 : 如 果 调 用 线程 阻 窜 在 其 中 的 
pthread_cond_wait 调 用 上 并 随后 被 取消 ， 它 就 在 仍 持 有 互 斥 锁 的 情况 下 
终止 ， 于 是 rw_nwaitreaders 计 数 器 的 值 出 错 。 图 8-6 中 
pthread_rwlock_wrlock 函 数 的 实现 也 存在 同样 的 问题 。 我 们 将 在 8.5 节 绚 
正 这 些 问题 。 

8.4.5 pthread_rwlock_tryrdlock P% žr 

图 8-5 给 出 我 们 的 pthread_rwlock_tryrdlock 函 数 ， 它 在 尝试 获取 一 个 
Wet BL EPA DH AE e 

11—14 “如果 当前 有 一 个 写 入 者 持 有 调用 者 指定 的 读 写 锁 ， 或 者 有 
线程 在 等 竺 该 恋 写 锁 的 一 个 写 入 锁 ， 那 束 返 回 EBUSY 错 误 。 人 否则 ， 通 
过 把 rw_refcount 加 1 获取 访谈 写 锁 。 






































my_rwlock/pthread_rwlock_tryrdlock.c 





1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 dnt 

4 pthread rwlock tryrdlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw->rw_magic != RW_MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) !- 0) 

10 return(result); 

TI if (rw->rw_refcount < 0 || rw->rw_nwaitwriters > 0) 

12 result = EBUSY; /* held by a writer or waiting writers */ 
13 else 

14 rw->rw_refcount++; /* increment count of reader locks */ 
15 pthread mutex unlock(&rw-»rw mutex); 

16 return(result); 

17 ) 





my rwlock/pthread rwlock tryrdlock.c 


图 8-5 pthread rwlock tryrdlockPA Zi: 试图 获取 一 个 读 出 锁 


8.4.6 pthread rwlock wrlockr& Zi 
图 8-6 给 出 了 我 们 的 pthread_rwlock_wrlock 函 数 。 





my_rwlock/pthread_rwlock_wrlock.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock wrlock(pthread rwlock t *rw) 
5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) != 0) 
10 return (result) ; 

11 while (rw->rw_refcount != 0) { 

12 rw->rw_nwaitwriters++; 

13 result = pthread cond wait (&rw->rw_condwriters, &rw-»rw mutex); 
14 rw-»rw nwaitwriters--; 

15 if (result !- 0) 

16 break; 

17 } 

18 if (result == 0) 

19 rw-»rw refcount = -1; 

20 pthread mutex unlock(&rw-»rw mutex); 
21 return (result); 

22 ) 





my rwlock/pthread rwlock wrlock.c 


图 8-6 pthread_rwlock_wrlock 函 数 : 获取 一 个 写 入 锁 

11—17 “只 要 有 读 出 者 持 有 由 调用 者 指定 的 读 写 锁 的 读 出 锁 ， 或 者 
有 一 个 写 入 者 持 有 访谈 写 锁 的 唯一 写 入 锁 〈 两 者 都 是 rw_refcount 不 为 0 
的 情况 ) ， 调 用 线程 就 得 阻塞 。 为 此 ， 我 们 把 rw_nwaitwriters 加 1， 然 后 
在 rw_condwriters 条 件 变 量 上 调用 pthread_cond_wait。 我 们 将 看 到 ， 疝 该 
条 件 变 量 发 送信 号 的 前 提 是 : 它 所 在 的 读 写 锁 被 释放 ， 并 且 有 写 入 者 正 
在 等 待 。 

18~19 取得 写 入 锁 后 把 rw_refcount 置 为 -1。 

8.4.7 pthread, rwlock trywrlock;& Zi 

Kj8-725 Hi Y 3ERH SERI HJpthread. rwlock trywrlockeg Zt. 11~14 
如 果 rw_refcount 不 为 0， 那 么 由 调用 者 指定 的 读 写 锁 或 者 由 一 个 写 入 者 
持 有 ， 或 者 由 一 个 或 多 个 读 出 者 持 有 《至 于 由 哪个 持 有 则 无 关 紧 要 ) ， 
因而 返回 一 个 EBUSY 错 误 。 人 否则 ， 获 取 该 读 写 锁 的 写 入 锁 ， 并 把 
rw_refcount 置 为 -1。 














my_rwlock/pthread_rwlock_trywrlock.c 





1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock trywrlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) != 0) 

10 return (result); 

LT if (rw-»rw refcount !- 0) 

12 result - EBUSY; /* held by either writer or reader(s) */ 
13 else 

14 rw-»rw refcount - -1; /* available, indicate a writer has it */ 
15 pthread mutex unlock(&rw-»rw mutex); 

16 return(result); 

a7’ } 


my_rwlock/pthread_rwlock_trywrlock.c 


图 8-7 pthread_rwlock_trywrlock 函 数 : 试图 获取 一 个 写 入 锁 








8.4.8 pthread_rwlock_unlock 函 数 


图 8-8 给 出 了 我 们 的 最 后 一 个 函数 pthread_rwlock_unlock。 

11—16 如 果 rw_refcount 当 前 大 于 0， 那 么 有 一 个 读 出 者 〈( 即 调用 线 
程 ) 准备 释放 一 个 读 出 锁 。 

如 果 rw_refcount 当 前 为 -1， 那 么 有 一 个 写 入 者 〈 即 调用 线程 ) 准备 
释放 一 个 写 入 锁 。17~22 ”如 果 有 一 个 写 入 者 在 等 待 ， 那 么 一 旦 由 调用 
者 指定 的 读 写 锁 变 得 可 用 《也 就 是 说 它 的 引用 计数 变 为 0) ， 就 问 
rw_condwriters 条 件 变量 发 送信 号 。 我 们 知道 只 有 一 个 写 入 者 能 够 获取 
该 读 写 锁 ， 因 此 调用 pthread_cond_signal 来 唤醒 一 个 线程 。 如 没有 写 入 
者 在 等 待 ， 但 是 有 一 个 或 多 个 读 出 者 在 等 待 ， 那 就 在 rw_condreaders 条 
件 变量 上 调用 pthread_cond_broadcast， 因 为 所 有 等 待 痢 的 读 出 者 都 可 以 
获取 一 个 读 出 锁 。 注 意 ， 一 旦 有 一 个 写 入 者 在 等 待 ， 我 们 就 不 给 任何 读 
出 者 授予 谈 出 锁 ， 人 否则 一 个 持续 的 读 请 求 流 可 能 永远 阻 堵 茶 个 等 待 着 的 
写 入 者 。 由 于 这 个 原因 ， 我 们 需要 两 个 分 开 的 if 条 件 测试 ， 而 不 能 写 
成 : 








/* give preference to waiting writers over waiting readers */ 
if (rw->rw_nwaitwriters > 0 && rw->rw_refcount == 0){ 
result = pthread_cond_signal(&rw->rw_condwriters); 
} else if (rw-»rw. nwaitreaders > 0) 


result = pthread_cond_broadcast(&rw->rw_condreaders); 


my_rwlock/pthread_rwlock_unlock.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock unlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) !- 0) 
10 return (result); 

Xi if (rw-»rw refcount » 0) 

12 rw-»rw refcount--; /* releasing a reader */ 
13 else if (rw-»rw refcount -- -1) 

14 rw-»rw refcount - 0; /* releasing a writer */ 
15 else 

16 err dump("rw refcount - $d", rw-»rw refcount); 

17 /* give preference to waiting writers over waiting readers */ 
18 if (rw-»rw nwaitwriters » 0) 

19 if (rw-»rw refcount -- 0) 

20 result - pthread cond signal(&rw-»rw condwriters); 
21 ) else if (rw-»rw nwaitreaders » 0) 

22 result = pthread cond broadcast(&rw-»rw condreaders); 
23 pthread mutex unlock(&rw-»rw mutex); 

24 return (result); 


25 ) 
my rwlock/pthread rwlock unlock.c 


图 8-8 pthread rwlock unlockPÉZ&: 释放 一 个 读 出 锁 或 号 入 锁 


我 们 也 可 以 省 略 对 rw->rw_refcount 的 测试 ， 不 过 那 会 导致 在 仍 分 配 
着 读 出 锁 的 情况 下 还 调用 pthread_cond_signal， 从 而 降低 了 效率 。 





8.5 线程 取消 


我 们 在 随 图 8-4 的 说 明 中 暗示 了 一 个 问题 ， 即 如 果 
pthread_rwlock_rdlock 的 调用 线程 阻塞 在 其 中 的 pthread_cond_wait 调 用 上 
并 随后 被 取消 ， 它 就 在 仍 持 有 互 斥 锁 的 情况 下 终止 。 通 过 由 对 方 调用 郴 
数 pthread_cancel， 一 个 线程 可 以 被 同一 进程 内 的 任何 其 他 线程 所 取消 

(cancel) ，pthread_cancel 的 唯一 参数 就 是 竺 取消 线程 的 线程 ID。 

#include <pthread.h> 

int pthread_cancel(pthread_t tid); 


返回 : APTA AO, A H Fer AIE I EXxx (Et 


举例 来 说 ， 如 果 局 动 了 多 个 线程 以 执行 某 个 给 定 任务 〈 辟 如 说 在 某 
个 数据 库 中 查找 一 个 记录 ) ， 那 么 首先 完成 任务 的 线程 可 使 用 线程 取消 
功能 取消 其 他 线程 。 另 一 个 例子 是 ， 当 多 个 线程 开始 执行 同一 个 任务 
时 ， 如 果 其 中 某 个 线程 发 现 一 个 错误 ， 它 和 其 他 线程 就 有 必要 终止。 

为 处 理 被 取消 的 可 能 情况 ， 任 何 线程 可 以 安装 〈 压 入 ) 和 删除 ( 弹 
出 ) 清理 处 理 程 序 。 

#include <pthread.h> 

void pthread_cleanup_push(void (*function)(void *),void *arg); 

void pthread_cleanup_pop(int execute); 

这 些 处 理 程序 就 是 发 生 以 下 情况 时 被 调用 的 函数 : 

调用 线程 被 取消 《由 某 个 线程 调用 pthread_cancel 完 成 ) ; 

调用 线程 自愿 终止 〈 或 者 通过 调用 pthread_exit， 或 者 从 上 自己 的 线程 
起 始 函 数 返 回 ) 。 

清理 处 理 程 序 可 以 恢复 任何 需要 恢复 的 状态 ， 例 如 给 调用 线程 当前 
持 有 的 任何 互 斥 锁 或 信号 量 解锁 。 

pthread_cleanup_push 的 function 参 数 是 调用 线程 被 取消 时 所 调用 的 
函数 的 地 址 ，arg 是 它 的 单个 参数 。pthread_cleanup_pop 总 是 删除 调用 线 
程 的 取消 清理 栈 中 位 于 栈 项 的 函数 ， 而 且 如 果 execute 不 为 0， 那 就 调用 
该 函数 。 

我 们 将 随 图 15-31 再 次 过 到 线程 取消 ， 那 时 我 们 将 看 到 ， 在 茶 个 过 
程 调用 正在 处 理 期 间 如 果 客 户 终止 ， 门 服务 器 就 被 取消 。 

例子 

说 明 上 一 市 中 我 们 的 实现 所 存在 问题 的 最 简易 方法 是 给 出 例子 。 图 
8-9 给 出 了 测试 程序 的 时 间 线 图 ， 图 8-10 给 出 了 程序 本 身 。 











时 间 


主线 程 线程 1 线程 2 


pthread create 一 一 一 一 一 > 取得 读 出 锁 
Sleep (1) sleep (3) 
Uomo CE cr MNA S S a ere -> 试图 取得 写 入 锁 
pthread join 
m | a p 
s * gi 
SS "e 
a du" 
返回 pthread cancel ----- > 被 取消 
sleep (3) 


pthread_join 


EH | TF H 
ae | Be 有 
ji 锁 
释放 锁 
返回 < -------- return 
exit 


图 8-9 图 8-10 中 程序 的 时 间 线 图 





my_rwlock_cancel/testcancel.c 


#include "unpipc.h" 
#include "pthread rwlock.h" 
pthread rwlock t rwlock - PTHREAD RWLOCK INITIALIZER; 


pthread t tidl, tid2; 
void *threadl(void *), *thread2(void *); 


int 
main(int argc, char **argv) 


( 


void *status; 


Set concurrency (2); 

Pthread create(&tidl, NULL, threadl, NULL); 

sleep(1); /* let threadl() get the lock */ 
Pthread create(&tid2, NULL, thread2, NULL); 


Pthread join(tid2, &status); 
if (status !- PTHREAD CANCELED) 
printf("thread2 status = %p\n", status); 
Pthread join(tidl, &status) ; 
if (status != NULL) 
printf ("threadl status = %p\n", status); 


printf ("rw refcount = $d, rw nwaitreaders = %d, rw nwaitwriters = %d\n", 
rwlock.rw_refcount, rwlock.rw_nwaitreaders, 
rwlock.rw_nwaitwriters) ; 

Pthread rwlock destroy (&rwlock) ; 


exit (0); 


) 


void * 
threadl (void *arg) 
{ 
Pthread_rwlock_rdlock (&rwlock) ; 
printf ("thread1() got a read lock\n"); 
sleep (3) ; /* let thread2 block in pthread rwlock wrlock() */ 
pthread cancel (tid2); 
sleep(3); 
Pthread rwlock unlock (&rwlock) ; 
return (NULL) ; 


} 


void * 
thread2 (void *arg) 
{ 
printf ("thread2() trying to obtain a write lock\n"); 
Pthread rwlock wrlock(&rwlock); 
printf("thread2() got a write lock\n") ; /* should not get here */ 
sleep(1); 
Pthread rwlock unlock (&rwlock) ; 
return (NULL); 


my rwlock cancel/testcancel.c 


图 8-10 展示 线程 取消 的 测试 程序 


创建 两 个 线程 


10—13 创建 两 个 进程 ， 第 一 个 线程 执行 函数 threadl， 第 二 个 线程 执 
行 函 数 thread2。 创 建 第 一 个 线程 后 睡眠 1 秒 ， 以 允许 它 获 取 一 个 读 出 


锁 。 
等 符 线 程 终止 
14 一 23 首先 等 待 第 二 个 线程 ， 并 验证 其 状态 为 


PTHREAD_CANCEL 。 接 着 待 等 第 一 个 线程 ， 并 验证 其 状态 为 一 个 空 指 
针 。 然 后 输出 pthread_rwlock t 类 型 读 写 锁 结 构 中 两 个 计数 器 成 员 的 值 ， 
最 后 拱 毁 该 读 写 锁 。 

thread1 ef) 2 

26~36 第 一 个 线程 获取 一 个 读 出 锁 后 睡眠 3 秒 。 这 个 停顿 允许 男 一 
个 线程 〈 第 二 个 线程 ) 调用 pthread_rwlock_wrlock 并 阻塞 在 其 中 的 
pthread_cond_wait 调 用 中 ， 因 为 在 有 一 个 读 出 锁 活 跃 期 间 ， 是 无 法 提供 
写 入 锁 的 。 本 线程 然后 调用 pthread_cancel 取 消 另 一 个 线程 ， 再 睡眠 3 秒 
后 释放 所 持 有 的 读 出 锁 ， 然 后 终止 。 

thread2 ef) 2 

37—46 《第 二 个 线程 试图 获取 一 个 写 入 锁 《〈 这 是 不 可 能 取得 的 ， 
为 第 一 个 线程 已 经 获取 了 一 个 读 出 锁 ) 。 本 函数 的 其 余部 分 不 应 该 被 执 
Ts 

如 末 使 用 上 一 节 中 给 出 的 函数 运行 本 测试 程序 ， 那 么 我 们 将 得 到 如 
下 结果 : 

solaris % testcancel 

thread1()got a read lock 

thread2()trying to obtain a write lock 

而 且 肯 定 不 返回 shell 提 示 符 状态 。 该 程序 被 挂 起 。 发 生 如 下 步骤 。 

(1) 第 二 个 线程 调用 pthread_rwlock_wrlock (图 8-6) ， 阻 塞 在 其 中 的 
pthread_cond_wait 调 用 中 。 

(2) 第 一 个 线程 中 的 sleep(3) 返 回 ，pthread_cancel 被 接着 调用 。 





(3) 第 二 个 线程 被 取消 《这 儿 融 是 被 终止 ) 。 当 阻塞 在 某 个 条 件 变量 
等 待 中 的 一 个 线程 被 取消 时 ， 要 再 次 取得 与 该 条 件 变 量 关 联 的 互 斥 锁 ， 
然后 调用 第 一 个 线程 取消 清理 处 理 程序 。 我 们 尚未 安装 任何 线程 取消 
清理 处 理 程序 ， 但 是 所 关联 的 互 斥 锁 仍 然 在 该 线程 被 取消 前 再 次 取 
得 。) 因此 ， 当 第 二 个 线程 被 取消 时 ， 它 持 有 包含 在 读 写 锁 中 的 互 斥 
锁 ， 而 且 图 8-6 中 rw_nwaitwriters 的 值 已 被 加 ]。 

(4) 第 一 个 线程 调用 pthread_rwlock_unlcok， 但 它 永 远 阻 塞 在 其 中 的 
pthread_mutex_lock 调 用 中 (图 8-8)〉 ， 因 为 它 想 要 持 有 的 互 斥 锁 仍 然 由 
的 线程 锁 着 。 

是 我 们 去 掉 thread1 函 数 中 的 pthread_rwlock_unlock 调 用 ， 那 么 主 
Brem tan 


rw. refcount = 1,rw nwaitreaders = O,rw. nwaitwriters = 1 











pthread rwlock destroy error: Device busy 
第 一 个 计数 器 是 1， 因 为 我 们 删除 了 pthread_rwlock_unlock 调 用 ， 但 
是 最 后 一 个 计数 器 也 是 1， 因 为 它 是 由 第 二 个 线程 在 被 取消 前 加 1 了 的 计 
DER 
这 一 问题 纠正 起 来 很 简单 。 首 先 ， 给 图 8-4 中 的 
pthread_rwlock_rdlock 函 数 增加 两 行 代码 《前 有 加 号 指示 ) ， 它 们 把 
pthread_cond_wait 调 用 括 了 起 来 : 
rw-»rw nwaitreaders---; 
十 prhread_cleanup_push(rwlock_cancelrdwait,(void *)rw); 
+ pthread cleanup pop(0); 
result = pthread_cond_wait(&rw->rw_condreaders, &rw->rw_mutex); 
rw->rw_Nwaitreaders--; 
一 行 新 代码 建立 一 个 清理 处 理 程序 〈 我 们 的 rwlock_cancelrdwait 
函数 ) ， 它 的 单个 参数 将 是 读 写 锁 指针 rw。 如 果 pthread_cond_wait 返 
回 ， 第 二 行 新 代码 就 删除 这 个 清理 处 理 程序 。pthread_cleanup_pop 的 值 


为 0 的 单个 参数 指示 不 调用 该 处 理 程序 。 要 是 该 参数 不 为 0， 那 就 先 调 用 
这 个 清理 处 理 程序 再 删除 它 。 

如 果 pthread_rwlock_rdlock 的 调用 线程 在 阻塞 于 该 函数 中 的 
pthread_cond_wait 调 用 期 间 被 取消 ， 它 就 不 会 从 该 函数 返回 ， 而 是 会 调 
用 清理 处 理 程序 〈 在 重新 获取 所 关联 的 互 斥 锁 之 后 ， 我 们 已 在 前 面 的 第 
3 步 中 提 到 过 这 一 点 ) 。 

图 8-11 给 出 了 我 们 的 rwlock_cancelrdwait 函 数 ， 它 是 我 们 为 pthread 
rwlock_rdlock 建 立 的 清理 处 理 程 序 。8~9 ”把 rw_nwaitreaders 计 数 器 减 
1， 并 给 互 斥 锁 解 锁 。 这 是 在 调用 pthread_cond_wait 前 建立 的 “状态 >”， 其 
调用 线程 被 取消 时 必须 恢复 到 该 状态 。 

















my_rwlock_cancel/pthread_rwlock_rdlock.c 
3 static void 
4 rwlock_cancelrdwait (void *arg) 


5 { 


6 pthread_rwlock_t *rw; 
DU rw - arg; 
8 rw-»rw nwaitreaders--; 


pthread mutex unlock(&rw-»rw mutex); 


10 ) 
— my rwlock cancel/pthread rwlock rdlock.c 


图 8-11 rwlock cancelrdwaitEA Zi: 读 出 锁 的 清理 处 理 程 序 
对 图 8-6 中 pthread_rwlock_wrlock 函 数 进行 类 似 的 人 和 修正。 首先， 在 
pthread_cond_wait 调 用 前 后 各 增加 一 行 新 代码 : 


rw->rw_nNwaitwriters++; 
































十 prhread_cleanup_push(rwlock_cancelwrwait,(void *)rw); 
十 pthread cleanup pop(0); 
result = pthread cond wait(&rw-^rw condwriters,&rw-»rw mutex); 
rw-»rw nwaitwriters--; 
图 8-12 给 出 了 我 们 的 rwlcok_cancelwrwait 函 数 ， 它 是 清理 写 入 锁 请 
求 的 清理 处 理 程序 。 


my_rwlock_cancel/pthread_rwlock_wrlock.c 





3 static void 
4 rwlock_cancelwrwait (void *arg) 
84 


6 pthread rwlock t *rw; 
7 rw - arg; 
8 rw-»rw nwaitwriters--; 


pthread mutex unlock(&rw-»rw mutex); 


10 } 
my_rwlock_cancel/pthread_rwlock_wrlock.c 


图 8-12 rwlock_cancelwrwait 函 数 : 写 入 锁 的 清理 处 理 程序 


8 一 9 给 rw_nwaitwriters 计 数 堪 减 1， 并 给 互 斥 锁 解 锁 。 
用 这 些 新 函数 运行 图 8-10 中 的 测试 程序 ， 结 果 是 正确 的 : 


solaris % testcancel 




















thread1()got a read lock 

thread2()trying to obtain a write lock 

rw_refcount = 0,rw_nwaitreaders = 0,rw_nwaitwriters = 0 

三 个 计数 器 的 值 都 是 正确 的 ，thread1 从 它 的 pthread_rwlock_unlock 
调用 返回 ， 而 且 pthread_rwlock_destroy 不 返回 EBUSY 错 误 。 

本 节 仅 仅 是 线程 取消 的 一 个 概貌 。 它 还 有 许多 细节 ， 参 见 
[ Butenhof 1997] 的 5.3 节 。 








8.6 小 结 


与 普通 的 互 斥 相 比 ， 当 被 保护 数据 的 读 访 问 比 写 访问 更 为 频繁 时 ， 
读 写 锁 能 提供 更 高 的 并 发 度 。 本 章 讲述 的 由 Unix 98 定义 的 读 写 锁 函 数 
或 类 似 函 数 应 出 现在 某 个 未 来 的 Posix 标 准 中 。 这 些 函 数 与 第 7 章 讲 述 的 
TH. Fe BER BRU. 

读 写 锁 可 以 只 通过 使 用 互 斥 锁 和 条 件 变量 来 实现 ， 我 们 给 出 了 一 
实现 例子 。 这 个 实现 优先 考虑 等 待 着 的 写 入 者 ， aes ee 
等 待 着 的 读 出 者 。 

线程 可 能 在 阻塞 于 pthread_cond_wait 调 用 期 间 被 取消 ， 我 们 的 读 写 




















锁 实 现 允 许 看 到 这 种 情况 的 发 生 。 我 们 使 用 线程 取消 清理 处 理 程 序 解决 


了 这 个 问题 。 
习题 


8.1 ”修改 8.4 节 中 我 们 的 读 写 锁 实 现 ， 优 先 考 虑 该 出 者 而 不 是 写 入 


8.2 ”度量 并 比较 8.4 节 中 我 们 的 读 写 锁 实现 和 三家 提供 的 实现 的 性 


anp 
CC 
fe} 


第 9 音 y 3 n 


9.1 概述 


上 一 章 讲述 的 读 写 锁 是 作为 pthread_rwlock_ ft 数据 类 型 的 变量 在 内 存 
中 分 配 的 。 当 读 写 锁 是 在 单个 进程 内 的 各 个 线程 间 共 享 时 (默认 情 
DU) ， 这 些 变量 可 以 在 那个 进程 内 ; 当 读 写 锁 是 在 共享 某 个 内 存 区 的 进 
程 间 共 享 时 (假设 初始 化 它们 时 指定 了 PTHREAD_PROCESS_SHARED 
属性 ) ， 这 些 变量 应 该 在 该 共享 内 存 区 中 。 

本 章 讲 述 读 写 锁 的 一 种 扩展 类 型 ， 它 可 用 于 有 亲缘 关系 或 无 亲缘 关 
系 的 进程 之 间 共 享 某 个 文件 的 读 与 写 。 被 锁 住 的 文件 通过 其 描述 符 访 
问 ， 执 行 上 锁 操 作 的 函数 是 fcntl。 这 种 类 型 的 锁 通 常 在 内 核 中 维护 ， 其 
属 主 是 由 属 主 的 进程 ID 标识 的 。 这 意味 着 这 些 锁 用 于 不 同 进程 间 的 上 
锁 ， 而 不 是 用 于 同一 进程 内 不 同 线程 间 的 上 锁 。 

我 们 将 在 本 章 介绍 序列 号 持续 加 1 的 例子 。 考 虑 来 自 Unix 打 印 假 脱 
机 处 理 系 统 (BSD 下 使 用 1pr 命 令 访问 ，System V 下 使 用 了 p 命 令 访 问 ) 的 
下 述 情 形 。 把 一 个 打印 作业 加 到 打印 队列 中 《 供 另 一 个 进程 在 以 后 某 个 
时 候 打 印 ) 的 进程 必须 给 每 个 作业 赋 一 个 唯一 的 序列 号 。 只 是 在 该 进程 
运行 期 间 唯一 的 进程 ID 不 能 用 作 这 个 序列 号 ， 因 为 一 个 打印 作业 可 能 存 
在 很 长 时 间 ， 期 间 早先 把 它 加 到 打印 队列 中 的 进程 的 进程 ID 可 能 被 重 
用 。 男 外 ， 一 个 给 定 进程 可 以 往 某 个 队列 中 加 入 多 个 打印 作业 ， 而 每 个 
作业 都 需要 一 个 唯一 的 作业 号 。 打 印 假 脱 机 处 理 系 统 使 用 的 技巧 是 : 给 
每 台 打 印 机 准备 一 个 文件 ， 它 是 只 有 一 个 单行 的 ASCII 文 本 文件 ， 其 中 
含有 竺 用 的 下 一 个 序列 号 。 需 要 给 某 个 打印 作业 赋 一 个 序列 号 的 每 个 进 
程 都 得 经 历 以 下 三 个 步骤 。 

















(1) 读 序列 号 文件 。 

(2) 使 用 其 中 的 序列 号 。 

(3) 给 序列 号 加 1 并 写 回 文件 中 。 

问题 是 当 某 个 进程 在 执行 这 三 个 步骤 时 ， 另 一 个 进程 可 能 在 执行 同 
样 的 三 个 步骤 。 这 将 导致 混乱 ， 如 我 们 将 在 后 面 的 一 些 例子 中 看 到 的 那 
样 。 

我 们 刚刚 叙述 的 是 一 个 互 斥 问题 。 它 可 使 用 第 7 童 讲述 的 互 斥 锁 或 
第 8 章 讲 述 的 读 写 锁 来 解决 。 然 而 不 同 的 是 ， 我 们 假设 各 个 进程 彼此 无 
亲缘 关系 ， 从 而 让 使 用 这 些 技 巧 更 为 困难 。 我 们 可 以 让 这 些 进程 共享 某 
个 内 存 区 《如 本 书 第 4 部 分 所 述 ) ， 然 后 在 该 共享 内 存 区 中 使 用 某 种 类 
型 的 同步 变量 ， 不 过 对 于 无 杀 缘 关系 的 进程 ，fcntl 记 录 上 锁 往往 更 易 使 
用 。 男 一 个 因素 是 ， 我 们 随行 式 打 印 机 假 脱 机 处 理 系统 摘 述 的 问题 ， 在 
互 斥 锁 、 条 件 变量 和 读 写 锁 的 可 用 之 前 许多 年 承 存 在 。 记 录 上 锁 是 在 20 
世纪 80 年 代 早 期 加 到 Unix 中 的 ， 先 于 共享 内 存 区 和 线程 的 开发 。 

我 们 所 需 的 是 : 一 个 进程 能 够 设置 某 个 锁 ， 以 宣称 没有 其 他 进程 能 
够 访问 相应 的 文件 ， 直 到 第 一 个 进程 完成 访问 为 止 。 图 9-2 给 出 了 执行 
上 述 三 个 步骤 的 一 个 简单 程序 。 函 数 my_lock 和 my_unlock 分 别 用 于 刚 开 
始 时 给 序列 号 文件 上 锁 以 及 完成 序列 号 更 新 时 给 该 文件 解锁 。 我 们 将 给 
出 这 两 个 函数 的 多 种 实现 。 

20 每 次 循环 输出 序列 号 时 同时 输出 正在 运行 的 程序 的 名 字 
Cargv[0]) ， 因 为 这 个 main 函 数 与 不 同 版 本 的 上 锁 函 数 一 块 使 用 ， 而 我 
们 希望 看 到 哪个 版 本 在 输出 序列 号 。 

输出 进程 ID 需要 把 类 型 为 pid_t 的 变量 强制 转换 成 long 类 型 ， 然 后 使 
用 %1d 格 式 化 串 输出 。 其 原因 是 ， 尽 管 pid_t 是 一 个 整数 类 型 ， 但 我 们 不 
知道 它 的 大 小 int 或 1ong) ， 因 此 必须 假设 成 最 大 的 类 型 。 要 是 我 们 假 
设 它 是 int 类 型 并 使 用 %d 格 式 化 串 ， 但 是 实际 类 型 却 为 long， 那 么 代码 是 
错误 的 。 

















数 。 


为 展示 不 上 锁 的 后 果 ， 图 9-1 提 供 了 根本 不 上 锁 的 两 个 “< 上 锁 ” 函 





1 void 


2 my_lock(int fd) 


3 { 


4 return; 


5] 


6 void 


7 my unlock(int fd) 


8 ( 


9 return; 


10 ) 





图 9-1 不 上 锁 的 函数 











lock/locknone.c 


lock/locknone.c 


如 果 序 列 号 文件 中 的 序列 号 初始 化 为 1， 而 且 该 程序 只 有 一 个 副本 
在 运行 ， 那 么 结果 如 下 : 


solaris % locknone 


locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 


locknone: 





pid = 15491,seq# = 1 
pid = 15491,seq# = 2 
pid = 15491,seq# = 3 
pid = 15491,seq# = 4 
pid = 15491,seq# = 5 
pid = 15491,seq# = 6 
pid = 15491,seq# = 7 
pid = 15491,seq# = 8 
pid = 15491,seq# = 9 
pid = 15491,seq# = 10 
pid = 15491,seq# = 11 
pid = 15491,seq# = 12 
pid = 15491,seq# = 13 
pid = 15491,seq# = 14 


locknone: pid = 15491,seq# = 15 

locknone: pid = 15491,seq# = 16 

locknone: pid = 15491,seq# = 17 

locknone: pid = 15491,seq# = 18 

locknone: pid = 15491,seq# = 19 

locknone: pid = 15491,seq# = 20 

注意 main 函 数 〈 图 9-2) 是 在 一 个 名 为 lockmain.c 的 文件 中 ， 但 是 当 
我 们 将 它 与 不 执行 上 锁 的 “上 锁 ” 函 数 〈 图 9-1) 一 同 编译 和 链接 时 ， 称 
结果 的 可 执行 文件 为 locknone。 这 是 因为 我 们 将 提供 my_lock 和 
my_unlock 这 两 个 函数 的 其 他 实现 ， 它 们 使 用 不 同 的 上 锁 技巧 ， 因 此 我 
们 根据 所 用 的 上 锁 类 型 命名 可 执行 文件 。 


lock/lockmain.c 





1 #include "unpipc.h" 

2 #define SEQFILE "segno" /* filename */ 

3 void my lock(int), my unlock(int); 

4 int 

5 main(int argc, char **argv) 

e { 

7 int fd; 

8 long i, seqno; 

9 pid t pid; 

10 ssize t n; 

11 char line [MAXLINE + 1]; 

12 pid = getpid(); 

13 fd = Open(SEQFILE, O_RDWR, FILE MODE); 

14 for (i = 0; i < 20; i++) { 

15 my_lock (fd) ; /* lock the file */ 

16 Lseek(fd, OL, SEEK SET);  /* rewind before read */ 

17 n - Read(fd, line, MAXLINE); 

18 line[n] = '\0'; /* null terminate for sscanf */ 
19 n = sscanf(line, "%ld\n", &seqno); 

20 printf("$s: pid = $1d, seq# = %ld\n", argv[0], (long) pid, seqno); 
21 seqno++; /* increment sequence number */ 
22 snprintf (line, sizeof (line), "%ld\n", seqno) ; 

23 Lseek (fd, OL, SEEK SET); /* rewind before write */ 
24 Write(fd, line, strlen(line)); 

25 my unlock(fd); /* unlock the file */ 

26 } 

27 exit (0) ; 

28 } 


lock/lockmain.c 





图 9-2 文件 上 锁 例 子 的 main 函 数 
把 序列 所 重新 初始 化 为 1， 然 后 在 后 台 运 行 该 程序 两 次 ， 其 结 条 如 





solaris % locknone & locknone & 

solaris % locknone: pid = 15498,seq# = 1 
locknone: pid = 15498,seq# = 2 
locknone: pid = 15498,seq# = 3 
locknone: pid = 15498,seq# = 4 
locknone: pid = 15498,seq# = 5 
locknone: pid = 15498,seq# = 6 


locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
4 locknone: pid = 15499,seq# = 2 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 


locknone: 


pid = 15498, seq# = 7 

pid = 15498, seq# = 8 

pid = 15498,seq# = 9 

pid = 15498,seq# = 10 
pid = 15498,seq# = 11 
pid = 15498,seq# = 12 
pid = 15498,seq# = 13 
pid = 15498,seq# = 14 
pid = 15498,seq# = 15 
pid = 15498,seq# = 16 
pid = 15498,seq# = 17 
pid = 15498,seq# = 18 
pid = 15498,seq# = 19 
pid = 15498,seq# = 20 
pid = 15499, seq# = 1 


pid = 15499,seq# = 3 
pid = 15499, seq# = 4 
pid = 15499,seq# = 5 
pid = 15499,seq# = 6 
pid = 15499, seq# = 7 
pid = 15499,seq# = 8 
pid = 15499,seq# = 9 
pid = 15499,seq# = 10 
pid = 15499, seq# = 11 
pid = 15499, seq# = 12 
pid = 15499,seq# = 13 


到 本 行为 止 一 切 正常 


内 核 切换 进程 后 开始 出 


locknone: pid = 15499,seq# = 14 

locknone: pid = 15499,seq# = 15 

locknone: pid = 15499,seq# = 16 

locknone: pid = 15499,seq# = 17 

locknone: pid = 15499,seq# = 18 

locknone: pid = 15499,seq# = 19 

locknone: pid = 15499,seq# = 20 

我 们 首先 注意 到 shell 提 示 符 在 程序 输出 第 一 行 之 前 输出 。 这 是 正常 
的 ， 而 且 在 后 台 运 行程 序 时 经 常见 到 。 

前 20 行 输出 是 正常 的 ， 它 们 由 该 程序 的 第 一 个 实例 (进程 ID 为 
15498) 输出 。 但 是 该 程序 另 一 个 实例 〈 进 程 ID 为 15499) 的 第 一 行 输出 
中 却 出 现 了 问题 : 它 输出 一 个 值 为 1 的 序列 叶 ， 表 明 它 也 许 是 由 内 核 第 
一 个 启动 ， 当 它 读 完 序 列 号 文件 (序列 号 值 为 1) 后 ， 内 核 切换 另 一 个 
进程 来 运行 。 该 进程 直到 男 一 个 进程 终止 时 才 再 次 运行 ， 它 继续 执行 所 
用 的 值 是 在 内 核 切 换 进 程 前 已 读 出 的 值 1。 这 不 是 我 们 所 希望 的 。 每 个 
进程 读 出 、 加 1 然后 写 入 序列 号 文件 20 次 《从 而 恰好 有 40 行 输出 ) ， 因 
此 序列 号 的 最 终 值 应 该 是 40。 

我 们 需要 某 种 方法 以 允许 一 个 进程 在 执行 前 述 三 个 步骤 期 间 防 止 其 
他 进程 访问 序列 号 文件 。 这 融 是 说 ， 考 虑 到 其 他 进程 ， 这 三 个 步骤 应 作 
为 一 个 原子 操作 Catomic operation) 来 执行 。 看 这 个 问题 的 另 一 种 方式 
是 ， 图 9-2 中 调用 my_lock 和 调用 my_unlock 之 间 的 几 行 代码 构成 一 个 临 
FX (critical region) ， 如 第 7 章 中 所 述 。 

像 刚 才 所 示 的 那样 在 后 台 运 行 图 9-2 中 程序 的 两 个 实例 时 ， 其 输出 
是 非 确定 的 (nondeterministic) 。 每 次 运行 该 程序 的 两 个 实例 时 ， 不 能 
保证 得 到 同样 的 结果 。 如 果 早 先 所 列 的 三 个 步 又 因 考 虑 到 其 他 进程 而 原 
子 地 处 理 ， 从 而 产生 40 这 个 最 终 值 ， 那 么 结果 的 不 确定 性 不 表示 有 错 。 
但 是 如 果 这 三 个 步骤 不 是 原子 地 处 理 ， 往 往 会 产生 一 个 小 于 40 的 最 终 

















值 ， 那 就 不 正确 了 。 举 例 来 说 ， 我 们 并 不 关心 是 第 一 个 进程 先 把 序列 号 
从 1 递增 到 20， 第 二 个 进程 接着 从 21 递 增 到 40， 还 是 每 个 进程 都 运行 刚 
好 足够 长 时 间 ， 从 而 每 次 运行 把 序列 号 递增 2〈 第 一 个 进程 输出 1 和 2， 
然后 第 二 个 进程 输出 3 和 4， 如 此 等 等 ) 。 

非 确定 性 并 没有 造成 不 正确 。 造 成 程序 运行 正确 与 个 的 是 前 述 三 个 
步骤 是 否 原 子 地 执行 。 然 而 非 确定 性 往往 使 这 些 类 型 程序 的 调试 更 为 困 
难 。 














9.2 对 比 记 录 上 锁 与 文件 上 锁 


Unix 内 核 没 有 文件 内 的 记录 这 一 概念 。 任 何 关 于 记录 的 解释 都 是 由 
读 写 文件 的 应 用 来 进行 的 。 然 而 Unix 内 核 提 供 的 上 锁 特 性 却 用 记录 上 锁 
(record locking) 这 一 术语 来 描述 。 不 过 应 用 会 指定 文件 中 待 上 锁 或 解 
锁 部 分 的 字 节 范围 (byte range) 。 这 个 字 节 范围 是 否 跟 同一 文件 内 的 一 
个 或 多 个 逻辑 记录 有 关联 是 应 用 的 事 。 

Posix 记 录 上 锁定 义 了 一 个 特殊 的 字 节 范围 以 指定 整个 文件 ， 它 的 
起 始 偏 移 为 0( 文 件 的 开头 ) ， 长 度 也 为 0。 本 和 章 的 讨论 集中 于 记录 上 
锁 ， 文 件 上 锁 只 是 它 的 一 个 特例 。 

术语 粒度 (granularity) 用 于 标记 能 被 锁 住 的 对 象 的 大 小 。 对 于 
Posix 记 录 上 锁 来 说 ， 粒 度 就 是 单个 字 节 。 通 常情 况 下 粒度 越 小 ， 人 允许 
同时 使 用 的 用 户 数 束 越 多 。 举 例 来 说 ， 假 设 有 五 个 进程 几乎 同时 访问 一 
个 给 定 的 文件 ， 其 中 三 个 是 读 出 者 ， 两 个 是 写 入 者 。 再 假设 所 有 五 个 进 
程 准备 访问 该 文件 中 的 不 同 记录 ， 而 且 这 五 个 请 求 中 的 每 一 个 需 花 的 时 
则 几乎 相同 ， 壁 如 说 1 秒 。 如 果 上 锁 是 在 文件 级 别 ( 可 能 的 最 粗 粒 上 度 ) 
上 进行 的 ， 那 么 所 有 三 个 读 出 者 可 以 同时 访问 它们 各 上 自 的 记录 ， 但 是 那 
两 个 写 入 者 必须 等 到 所 有 读 出 者 完成 访问 为 止 。 然 后 其 中 一 个 写 入 者 可 
以 修改 自己 的 记录 ， 另 一 个 写 入 者 随后 可 以 这 么 做 。 总 的 时 间 将 大 约 是 

















3 秒 。“【 当 然 我 们 在 这 些 定 时 假设 中 忽略 了 许多 细节 。) 但 是 如 果 上 锁 
粒度 是 记录 《可 能 的 最 细 粒 度 ) ， 那 么 所 有 五 个 进程 都 能 同时 处 理 ， 
为 它们 各 自 访问 的 是 不 同 的 记录 。 于 是 总 的 时 间 只 有 1 秒 。 

源 自 Berkeley 的 Unix 实 现 文 持 给 整个 文件 上 锁 或 解锁 的 文件 上 锁 

(file locking) ， 但 没有 给 文件 内 的 字 节 范围 上 锁 或 解锁 的 能 力 。 文 件 
上 锁 由 flock 函 数 提供 。 

历史 

多 年 来 Unix 下 的 文件 和 记录 上 锁 已 应 用 了 各 种 各 样 的 技巧 。 诸 如 
UUCP 和 守护 进程 和 行 式 打印 机 守护 进程 之 类 的 早期 程序 所 使 用 的 各 种 技 
巧 充分 利用 了 文件 系统 实现 上 的 特色 。 (我 们 将 在 9.8 节 讨论 其 中 三 个 
文件 系统 技巧 。) 然而 这 些 技巧 使 用 起 来 速度 比较 慢 ， 因 此 20 世 纪 80 年 
代 早 期 实现 的 数据 库 系统 提出 了 使 用 更 好 技巧 的 要 求 。 

第 一 个 真正 的 文件 和 记录 上 锁 是 由 John Bass 于 1980 年 加 到 Version 7 
中 的 ， 新 增 的 一 个 系统 调用 名 为 locking。 它 提供 强制 性 记录 上 锁 ， 并 为 
System II 和 Xenix 的 许多 版 本 所 沿用 。“ 我 们 将 在 本 章 以 后 说 明 强 制 性 
上 锁 和 劝告 性 上 锁 的 区 别 ， 以 及 记录 上 锁 和 文件 上 锁 的 区 列 。) 

4.2BSD 于 1983 年 通过 flock 函 数 提供 了 文件 上 锁 (不 是 记录 上 
锁 ) 。1984 年 的 /usr/group 标 准 (X/Open 的 前 身 之 一 ) 定义 了 lockf 函 
数 ， 它 只 提供 独占 锁 《〈 即 写 入 锁 ) ， 而 没有 提供 共享 锁 〈 即 读 出 锁 ) 。 

System V Release 2 (SVR2) 于 1984 年 通过 fcntl 函 数 提供 了 劝告 性 
记录 上 锁 。lockf 函 数 也 提供 了 ， 但 它 只 是 一 个 调用 fcnt 的 库 函 数 ， 而 不 
是 系统 调用 。【〔 许 多 当前 的 系统 仍然 提供 使 用 fentl 完 成 的 lockf 实 现 。) 
System V Release 3 (SVR3) 于 1986 年 给 fcntl 增 加 了 强制 性 记录 上 锁 能 
力 ， 它 使 用 了 文件 的 SGID 权 限 位 ， 我 们 将 在 9.5 节 中 讨论 。 

1988 年 的 Posix.1 标 准 对 fentl 函 数 的 劝告 性 文件 和 记录 上 锁 功能 进行 
了 标准 化 ， 这 就 是 本 章 要 讲述 的 内 容 。X/Open 可 移植 性 指南 第 3 期 
(X/Open Portability Guide Issue 3, faj#KXPG3, 19884F) 也 指出 记录 上 








锁 通 过 fcnt 函 数 提供 。 
9.3 Posix fcntli 记 录 上 锁 


记录 上 锁 的 Posix 接 口 是 fcntl 函 数 。 

#include <fcntl.h> 

in.fentl(in.fd,in.cmd,.../.struc.floc.*ar.*.); 

返回 : ATU Femd, 4 KA-1 

用 于 记录 上 锁 的 cmd 参 数 共 有 三 个 值 。 这 三 个 命令 要 求 第 三 个 参数 
arg 是 指向 某 个 flock 结 构 的 指针 : 

struct flock { 

shortl type; /* F RDLCK,F WRLCK,F UNLCK */ 

short ] whence; /* SEEK SET,SEEK. CUR,SEEK END */ 
off t1 start; /* relative starting offset in bytes */ 

off t1 len: /* bytes; 0 means until end-of-file */ 

pid t1 pid; /* PID returned by F GETLK */ 

H 

这 三 个 命令 如 下 。 

F_SETLK ”获取 (1_type 成 员 为 F_RDLCK 或 F_WRLCK) 或 释放 

(1_type 成 员 为 F_UNLCK)〉 由 arg 指 向 的 flock 结 构 所 描述 的 锁 。 

如 果 无 法 将 该 锁 授 予 调 用 进程 ， 该 函数 就 立即 返回 一 个 EACCES 或 
EAGAIN 错 误 而 不 阻塞 。 

F_SETLKW 该 命令 与 上 一 个 命令 类 似 ， 不 过 如 果 无 法 将 所 请 求 的 
锁 授 予 调用 进程 ， 调 用 线程 将 阻塞 到 该 锁 能 够 授予 为 止 。《 该 命令 的 名 
字 中 最 后 一 个 字母 W 意 思 是 “等 待 (wait) ". ) [1] 

F GETLK 检查 由 arg 指 向 的 锁 以 确定 是 否 有 某 个 已 存在 的 锁 会 妨碍 
将 新 锁 授予 调用 进程 。 如 果 当 前 没有 这 样 的 锁 存 在 ， 由 arg 指 疝 的 flock 














结构 的 ]_type 成 员 就 被 置 为 F_UNLCK。 和 否则 ， 关 于 这 个 已 存在 锁 的 信息 
将 在 由 arg 指 向 的 flock 结 构 中 返回 (也 就 是 说 ， 该 结构 的 内 容 由 fcntl 函 数 
履 写 ) ， 其 中 包括 持 有 该 锁 的 进程 的 进程 ID。 [2] 

应 清楚 发 出 F_GETLK 命 令 后 紧 接 着 发 出 F_SETLK 命 令 不 是 一 个 原 
子 操作 。 这 就 是 说 ， 如 果 我 们 发 出 F_GETLK 命 令 ， 并 且 执 行 该 命令 的 
fcntl 函 数 返 回 时 置 ]_type 成 员 为 F_UNLCK， 那 么 跟着 立即 发 出 F_SETLK 
命令 不 能 保证 其 feantl 函 数 会 成 功 返 回 。 这 两 次 调用 之 间 可 能 有 男 外 一 个 
进程 运行 并 获取 了 我 们 想 要 的 锁 。 

提供 FE_GETLK 命 令 的 原因 在 于 : 当 执 行 F_SETLK 命 令 的 fcntl 函 数 
返回 一 个 错误 时 ， 寻 致 该 错误 的 某 个 锁 的 信息 可 由 F_GETLK 命 令 返 
回 ， 从 而 允许 我 们 确定 是 哪个 进程 锁 住 了 所 请 求 的 文件 区 ， 以 及 上 锁 方 
A SEH BBS AB) 。 但 是 即使 是 这 样 的 情形 ，F_GETLK 命 令 也 可 
能 返回 该 文件 区 已 解锁 的 信息 ， 因 为 在 F_SETLK 和 F_GETLK 命 令 之 
间 ， 该 文件 区 可 能 被 解锁 。 

flock 结 构 描 述 锁 的 类 型 〈 读 出 锁 或 写 入 锁 ) 以 及 待 锁 住 的 字 节 范 
围 。 跟 lseek 一 样 ， 起 始 字 节 偏 移 是 作为 一 个 相对 偏 移 (1_start 成 员 ) fF 
随 其 解释 〈]_whence 成 员 ) 指定 的 。1_whence 成 员 有 以 下 三 个 取 值 。 

SEEK, SET: 1_start 相 对 于 文件 的 开头 解释 。 

SEEK_CUR: 1_start 相 对 于 文件 的 当前 字 节 偏 移 〈 即 当前 读 写 指针 
位 置 ) 解释 。 

SEEK, END: 1_start 相 对 于 文件 的 末尾 解释 。 

1_len 成 员 指 定 从 该 偏 移 开始 的 连续 字 节 数 。 长 度 为 0 意思 是 “从 起 始 
偏 移 到 文件 偏 移 的 最 大 可 能 值 >。 因 此 ， 锁 住 整个 文件 有 两 种 方式 。 

() 指 定 ]_whence 成 员 为 SEEK_SET，1]_start 成 员 为 0，]_jlen 成 员 为 




















(2) 使 用 lseek 把 读 写 指针 定位 到 文件 涉 ， 然 后 指定 1]_whence 成 员 为 
SEEK_CUR，1]_start 成 员 为 0，1 len 成 员 为 0。 


第 一 种 方式 最 第 用， 因为 它 只 需 一 个 函数 调用 〈fcntl) 而 不 是 两 个 
( 男 见 习题 9.10) 。 

fcntl 记 录 上 锁 既 可 用 于 读 也 可 用 于 写 ， 对 于 一 个 文件 的 任意 字 市 ， 
最 多 只 能 存在 一 种 类 型 的 锁 〈 读 出 锁 或 写 入 锁 ) 。 而 且 ， 一 个 给 定 字 市 
可 以 有 多 个 读 出 锁 ， 但 只 能 有 一 个 写 入 锁 。 这 跟 我 们 在 上 一 章 讲 述 的 读 
写 锁 是 一 致 的 。 上 自然 ， 当 一 个 描述 符 不 是 打开 来 用 于 读 时 ， 如 果 我 们 对 
它 请 求 一 个 读 出 锁 ， 错 误 就 会 发 生 ， 同 样 ， 当 一 个 描述 符 不 是 打开 来 用 
于 写 时 ， 如 果 我 们 对 它 请 求 一 个 号 入 锁 ， 错 误 也 会 及 生 。 

对 于 一 个 打开 着 某 个 文件 的 给 定 进程 来 说 ， 当 它 关 闭 该 文件 的 所 有 
描述 符 或 它 本 吴 终 止 时 ， 与 该 文件 关联 的 所 有 锁 都 被 删除 。 [3] 锁 不 能 
通过 fork 由 子 进程 继承 。 

在 进程 终止 时 由 内 核 完成 己 有 锁 清 理工 作 的 特性 只 有 fcnti 记 录 上 锁 
完全 提供 了 ， System V 信 号 量 则 把 它 作为 一 个 选项 提供 。 我 们 讲述 的 其 
他 同步 技巧 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、Posix 信 号 量 ) 并 不 在 进程 
终止 时 执行 清理 工作 。 我 们 已 在 7.7 节 末尾 讨论 过 这 一 点 。 

记录 上 锁 不 应 该 同 标准 WO 函数 库 一 块 使 用 ， 因 为 该 函数 库 会 执行 
内 部 缓冲 。 当 某 个 文件 需 上 锁 时 ， 为 避免 问题 ， 应 对 它 使 用 read 和 
Write。 

9.3.1 例子 

现在 回 到 图 9-2 中 的 例子 ， 并 把 图 9-1 中 的 两 个 函数 my_lock 和 
my_unlock 重 新 编写 成 使 用 Posix 记 录 上 锁 。 网 9-3 给 出 了 这 些 函数 。 

注意 ， 我 们 必须 指定 写 入 锁 ， 以 保证 任何 时 刻 只 有 一 个 进程 更 新 序 
列 号 〈 见 习题 9.4) 。 在 获取 该 锁 时 所 指定 的 命令 为 F_SETLKW， 因 为 
如 采 该 锁 不 可 得 ， 那 么 我 们 和 希望 阻塞 到 它 变 为 可 得 为 止 。 

有 了 早先 给 出 的 flock 结 构 的 定义 后 ， 有 人 可 能 认为 在 my_lock 中 可 
以 如 下 初始 化 我 们 的 结构 : 

static struct flock lock = { F WRLCK,SEEK_ SET.,0,0,0 }; 














然而 这 是 错误 的 。Posix 只 定义 在 一 个 结构 《例如 flock) 中 的 必需 
成 员 。 各 个 实现 可 以 以 任意 顺序 排列 这 些 成员 ， 还 可 以 增设 特定 于 实现 
的 成 员 。 





lock/ockfentl.c 
1 #include "unpipc.h" 
2 void 
3 my lock(int fd) 
4 { 
5 struct flock lock; 
6 lock.l type = F WRLCK; 
7 lock.1 whence = SEEK SET; 
8 lock.l start = 0; 
9 lock.l len = 0; /* write lock entire file */ 
10 Fcntl(fd, F SETLKW, &lock); 
11 ) 
12 void 
13 my unlock(int fd) 
14 ( 
15 struct flock lock; 
16 lock.1 type = F UNLCK; 
E7 lock.l_whence = SEEK_SET; 
18 lock.l_start = 0; 
19 lock.1_len = 0; /* unlock entire file */ 
20 Fentl (fd, F SETLK, &lock) ; 
21 } 
lock/ockfentl.c 





图 9-3 Posix fentl_ it 

我 们 不 给 出 结果 输出 ， 但 它 看 来 是 正确 的 。 需 认识 到 运行 像 图 9-2 
这 样 的 简单 程序 不 足以 告诉 我 们 程序 是 人 否 正 常 工作。 如 果 输 出 像 我们 先 
前 看 到 的 那样 是 错误 的 ， 那 么 可 以 断言 程序 不 正确 ， 但 是 如 果 只 运行 它 
的 两 个 副本 ， 每 个 副本 只 循环 20 次 ， 那 么 测试 是 不 充分 的 。 内 核 可 能 运 
行 一 个 程序 更 新 序列 号 20 次 ， 再 运行 另 一 个 程序 更 新 序列 号 20 次 。 如 果 
这 两 个 进程 中 途 不 发 生 切 换 ， 我 们 就 可 能 永远 发 现 不 了 错误 。 更 好 的 测 
试 是 : 使 用 另外 一 个 main 函 数 运行 图 9-3 中 的 函数 ， 这 个 main 函 数 给 序 
列 号 加 1 譬如 说 1 万 次 ， 每 次 循环 时 不 再 输出 值 。 如 果 我 们 把 序列 号 初始 
化 为 1， 然 后 同时 运行 该 程序 的 20 个 副本 ， 那 么 序列 号 文件 的 最 终 值 应 
该 是 200 001. 


























9.3.2 例子 : 简化 用 的 宏 
图 9-3 中 ， 请 求 或 释放 一 个 锁 需 6 行 代码 。 我 们 必须 分 配 一 个 结构 ， 
填写 这 个 结构 ， 然 后 调用 fcntl。 通 过 定义 来 自 APUE 的 12.3 节 的 以 下 7 个 
宏 ， 可 以 简化 我 们 的 程序 : 
#define read_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLK,F_RDLCK,offset,whence,len) 
#define readw_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLKW,F_RDLCK,offset,whence,len) 
#define write_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLK,F_WRLCkK,offset,whence,len) 
#define writew_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLKW,F_WRLCK,offset,whence,len) 
#define un_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLK,F_UNLCK,offset,whence,len) 
#define is_read_lockable(fd,offset,whence,len)\ 
lock test(fd,F RDLCK,offset,whence,len) 
#define is write lockable(fd,offset,whence,len) 
lock test(fd,F WRLCK,offset,whence,len) 
这 些 宏 使 用 我 们 的 lock_reg 和 ]lock test 函数 ， 它 们 在 图 9-4 和 图 9-5 中 
给 出 。 使 用 这 些 宏 时 ， 不 必 考 虑 flock 结 构 和 真正 调用 的 函数 。 这 些 宏 的 
前 三 个 参数 有 意 安排 成 跟 lseek 函 数 的 前 三 个 参数 相同 。 





lib/lock_reg.c 





1 #include "unpipc.h" 
2 int 
3 lock reg(int fd, int cmd, int type, off t offset, int whence, off t len) 
4 { 
5 struct flock lock; 
6 lock.l type = type; /* F RDLCK, F WRLCK, F UNLCK */ 
7 lock.l start = offset; /* byte offset, relative to 1 whence */ 
8 lock.l whence = whence;  /* SEEK SET, SEEK CUR, SEEK END */ 
9 lock.l len = len; /* #bytes (0 means to EOF) */ 
10 return( fcntl(fd, cmd, &lock) ); /* -1 upon error */ 
11 ) 
lib/lock reg.c 
图 9-4 调用 fcnt 获 取 或 释放 一 个 锁 
lib/lock test.c 
1 #include "unpipc.h" 
2 pid t 
3 lock test(int fd, int type, off t offset, int whence, off t len) 
a{ 
5 struct flock lock; 
6 lock.1 type = type; /* F_RDLCK or F_WRLCK */ 
7 lock.l start = offset; /* byte offset, relative to 1 whence */ 
8 lock.1_ whence = whence;  /* SEEK SET, SEEK CUR, SEEK END */ 
9 lock.l len = len; /* #bytes (0 means to EOF) */ 
10 if (fentl(fd, F GETLK, &lock) == -1) 
11 return(-1); /* unexpected error */ 
12 if (lock.l type -- F UNLCK) 
13 return(0); /* false, region not locked by another proc */ 
14 return(lock.l pid); /* true, return positive PID of lock owner */ 
15 ) 





lib/lock test.c 


图 9-5 调用 fcnt 测 试 一 个 锁 





我 们 还 定义 了 两 个 包 庄 函数 Lock_reg 和 Lock_ test, “AJE fetl H të 
时 输出 一 个 错误 并 终止 。 另 有 7 个 同名 但 首 字母 大 写 的 宏 ， 它 们 调用 这 
VIA LEE ER BX 

使 用 这 些 宏 ， 图 9-3 中 的 my_lock 和 my_unlock 函 数 变 为 : 

#define my_lock(fd) (Writew_lock(fd,0,SEEK_SET,0)) 

#define my unlock(fd) (Un_lock(fd,0,SEEK_SET,0)) 








9.4 劝告 性 上 锁 


Posix 记 录 上 锁 称 为 劝告 性 上 锁 Cadvisory locking) 。 共 含义 是 内 核 
维护 着 已 由 各 个 进程 上 锁 的 所 有 文件 的 正确 信息 ， 但 古 它 不 能 防止 一 个 
进程 写 已 由 男 一 个 进程 读 锁定 的 某 个 文件 。 类 似 地 ， 它 也 不 能 防止 一 个 
进程 读 已 由 男 一 个 进程 写 锁定 的 某 个 文件 。 一 个 进程 能 够 无 视 一 个 劝告 
性 锁 而 写 一 个 读 锁 定 文 件 ， 或 者 读 一 个 写 锁定 文件 ， 前 提 是 该 进程 有 读 
或 写 该 文件 的 足够 权限 。 

劝告 性 锁 对 于 协作 进程 (cooperating processes) 是 足够 了 。 网 络 编 
程 中 守护 程序 的 编写 是 协作 进程 的 一 个 例子 : 这 些 程序 访问 诸如 序列 号 
文件 之 类 的 共享 资源 ， 而 且 都 在 系统 管理 员 的 控制 之 下 。 只 要 含有 序列 
号 的 真正 文件 不 是 任何 进程 都 可 写 ， 那 么 在 该 文件 被 锁 住 期 间 ， 不 理会 
劝告 性 锁 的 随意 进程 无 法 写 它 。 

例子 : 非 协作 进程 

通过 运行 我 们 的 序列 号 程序 的 两 个 实例 ， 融 能 展示 Posix 记 录 上 锁 
是 劝告 性 的 ， 这 两 个 实例 是 : 使 用 图 9-3 中 函数 的 lockfcntt， 它 在 给 序列 
写 加 1 前 先 锁 住 文件 ， 以 及 使 用 图 9-1 中 函数 的 locknone， 它 不 执行 上 
锁 。 

solaris % lockfcntl & locknone & 

lockfcntl: pid = 18816,seq# = 1 

lockfcntl: pid = 18816,seq# = 2 

lockfcntl: pid = 18816,seg# = 3 

lockfcntl: pid = 18816,seq# = 4 

lockfcntl: pid = 18816,seg# = 5 

lockfcntl: pid = 18816,seq£ = 6 

lockfcntl: pid = 18816,seq£ = 7 

lockfcntl: pid = 18816,seg# = 8 

lockfcntl: pid = 18816,seg# = 9 

lockfcntl: pid = 18816,seq£ = 10 











lockfcntl: pid = 18816,seq# = 11 


locknone 
locknone: pid 
locknone 
locknone 
locknone 
locknone 
locknone 


locknone 


lockfcntl: 


: pid = 18817,seq# 
= 18817,seq# = 12 
: pid = 18817,seq# = 13 
: pid = 18817,seq# = 14 
: pid = 18817,seq# = 15 
: pid = 18817,seq# = 16 
: pid = 18817,seq# = 17 
: pid = 18817,seq# = 18 
pid = 18816,seq# = 12 


pid = 18816,seq# = 13 
lockfcntl: pid = 18816,seq# = 14 
lockfcntl: pid = 18816,seq£ = 15 
lockfcntl: pid = 18816,seq£ = 16 
lockfcntl: pid = 18816,seq# = 17 
lockfcntl: pid = 18816,seq£ = 18 
lockfcntl: pid = 18816,seq£ = 19 


lockfcntl: 


locknone 
locknone: pid 
locknone 
locknone 
locknone 
locknone 
locknone 
locknone 


locknone 


pid = 18816,seq# = 20 
: pid = 18817,seq# 
= 18817,seq# = 20 
: pid = 18817,seq# = 21 
: pid = 18817,seq# = 22 
: pid = 18817,seq# = 23 
: pid = 18817,seq# = 24 
: pid = 18817,seq# = 25 


: pid = 18817,seq# = 26 
: pid = 18817,seq# = 27 


11 


19 


切换 进程 ， 出 错 


切换 进程 ， 出 错 lockfentl: 


切换 进程 ， 出 错 


locknone: pid = 18817,seq# = 28 

locknone: pid = 18817,seq# = 29 

locknone: pid = 18817,seq# = 30 

lockfcntl 程 序 首先 运行 ， 但 是 在 它 执 行将 序列 号 从 11 增 加 到 12 的 三 
个 步骤 期 间 〈 此 间 它 持 有 整个 文件 的 锁 ) ， 内 核 切 换 进 程 ， 并 且 
locknone 程 序 运 行 。 该 新 程序 读 出 的 序列 号 值 是 lockfcntl 程 序 写 回 序列 
号 文件 之 前 的 11。 由 lockfcntl 程 序 持 有 的 劝告 性 记录 锁 对 locknone 程 序 
没有 影 啊 。 





9.5 强制 性 上 锁 


有 些 系 统 提 供 另 一 种 类 型 的 记录 上 锁 ， 称 为 强制 性 上 锁 
(mandatory locking) 。 使 用 强制 性 锁 后 ， 内 核 检 查 每 个 read 和 write 请 
求 ， 以 验证 其 操作 不 会 干扰 由 某 个 进程 持 有 的 某 个 锁 。 对 于 通 弟 的 阻塞 
式 摘 述 符 ， 与 某 个 强制 性 锁 冲 突 的 read 或 write 将 把 调用 进程 投入 睡 虐 ， 
直到 该 锁 释 放 为 止 。 对 于 非 阻 窜 式 描述 符 ， 与 某 个 强制 性 锁 冲 突 的 read 
或 write 将 导致 它们 返回 一 个 EAGAIN 错 误 。 

Posix.1 和 Unix 98 只 定义 劝告 性 上 锁 。 然 而 源 自 System V 的 许多 实现 
却 同时 提供 劝告 性 上 锁 和 强制 性 上 锁 。 强 制 性 记录 上 锁 是 随 System V 
Release 3 引入 的 。 

为 对 某 个 特定 文件 施行 强制 性 上 锁 ， 应 满足 : 

组 成 员 执 行 位 必须 关 挥 ; 

SGID 位 必须 打开 。 

注意 ， 打 开 某 个 文件 的 SUID 位 而 不 打开 它 的 用 户 执 行 位 是 没有 意 
义 的 ， 同 样 ， 打 开 SGID 位 而 不 打开 组 成 员 执 行 位 也 没有 意义 。 因 此 ， 
以 这 种 方式 加 上 的 强制 性 锁 不 会 影响 任何 现 有 的 用 户 软 件 。 强 制 性 上 锁 
不 需要 新 的 系统 调用 。 


在 文 持 强制 性 记录 上 锁 的 系统 上 ，1ls 命 令 查找 权限 位 的 这 种 特殊 组 
合 ， 并 输出 ] 或 直 以 指示 相应 文件 的 强制 性 上 锁 是 否 局 用 。 类 似 地 ， 
chmod 命 令 接受 ] 这 个 指示 符 以 给 某 个 文件 启用 强制 性 上 锁 。 

例子 

初 看 起 来 ， 使 用 强制 性 上 锁 应 该 解决 非 协作 进程 的 问题 ， 因 为 非 协 
作 进 程 对 被 锁 住 文件 的 任何 read 或 write 调用 都 将 阻塞 进程 本 身 ， 直 到 该 
文件 的 锁 被 释放 为 止 。 不 对 的 是 ， 定 时 间 题 相当 复杂 ， 这 一 点 我 们 很 容 
易 展 示 。 

要 把 我 们 使 用 fcnt 的 例子 转换 成 使 用 强制 性 上 锁 ， 上 所 需 做 的 是 修改 
seqno 文 件 的 权限 位 。 我 们 还 改 用 男 一 个 版 本 的 main 函 数 ， 它 的 for 循 环 
次 数 取 上 自 第 一 个 命令 行 参数 (而 不 是 使 用 常 值 20) ， 每 次 循环 时 不 再 调 
用 printf。 





solaris % cat > seqno 首先 把 序列 号 值 初 
始 化 为 1 

1 

AD Ctrl+D ERK 


们 的 终端 文件 结束 符 

solaris 96 Is -| seqno 

-IW-r-r-- 1 rstevens other1 2O0ct 711:24 seqno 

solaris % chmod +] seqno 启用 强制 性 上 锁 

solaris 96 Is -] seqno 

-rw-r-lr--  1rstevens other1 2O0ct 711:24 seqno 

现在 在 后 台 启 动 两 个 程序 : loopfentlfii H fetl E, loopnone^^ E 
锁 。 所 指定 的 命令 行 参 数 为 10 ”000， 它 是 每 个 程序 读 出 、 加 1 再 写 入 序 
列 号 的 次 数 。 

solaris % loopfcntl 10000 & loopnone 10000 & ”在 后 台 同 时 启动 两 
个 程序 


solaris % wait 等 待 这 两 
个 后 合作 业 的 完成 

solaris % cat seqno 然后 查看 序 
Js 

14378 出 
错 : 应 该 是 20 001 

每 次 运行 这 两 个 程序 ， 最 终 的 序列 号 通常 在 14 000 和 16 000 之 间 。 
如 果 上 锁 像 期 望 的 那样 工作 的 话 ， 最 终 值 应 该 总 是 为 20 001。 为 查看 错 
误 发 生 位 置 ， 我 们 需要 画 出 具体 到 每 个 步骤 的 时 间 线 图 ， 如 图 9-6 所 
不 。 
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lockfcntl 


l. open () 

2. 上 锁 文 件 
3. read() 一 1 
4. 加 1 

5. write()2 
6. 解锁 文件 
7. EBC FE 


8. d()-*2 
read 0 内 核 切换 进程 ~ 


一 内 核 切换 进程 


13. 加 1 
14. write() 一 3 


15. 解锁 文件 内 核 切换 进程 一 


一 内 核 切 换 进程 


25. 上 锁 文 件 
26. read()—5 
27. 加 1 

28. write() 一 0 
29. 解锁 文件 
30. 上 锁 文 件 
31. read() 一 0 
32. 加 1 

33. write() 一 7 


34. 解锁 文 
para 内 核 切换 进程 ~ 


locknone 


10. open () 
11. read () BASE 


17. read () ^3 
18. 加 1 

19. write () 一 4 
20. read() 一 4 
21. 加 1 

22. write ()—>5 
23. read() ^5 


36. 加 1 
37. write() 一 0 


图 9-6 loopfcntt 和 ]loopnone 程 序 的 时 间 线 图 


我 们 假设 loopfcntl 程 序 首先 启动， 执行 图 中 所 示 前 8 个 步骤 。 然 后 内 
核 在 loopfcntl 持 有 序列 号 文件 的 一 个 记录 锁 期 间 切 换 进 程 。 于 是 
loopnone 启 动 ， 但 是 它 的 第 一 个 read 阻 塞 了 ， 因 为 它 想 从 中 读 出 序列 号 
的 文件 有 一 个 由 男 一 个 进程 持 有 的 未 释放 强制 性 锁 。 我 们 假设 内 核 把 进 
程 切 换 回 第 一 个 程序 ， 由 它 执行 第 13、14 和 15 步 。 这 是 我 们 期 待 的 行 
WA: 内核 阻 塞 来 自 非 协作 进程 的 read， 因 为 它 试图 读 的 文件 由 另 一 个 进 
程 锁 痢 。 

然后 内 核 切 换 进 程 到 locknone 程 序 ， 由 它 执行 第 17 一 23 步 。 这 些 步 
骤 中 的 read 和 write 是 允许 的 ， 因 为 第 一 个 程序 已 在 第 15 步 给 序列 号 文件 
解锁 。 然 而 ， 当 该 程序 在 第 23 步 read 到 值 为 5 的 序列 号 ， 接 着 内 核 切换 
到 第 一 个 进程 时 ， 问 题 就 发 生 了 。 第 一 个 进程 接着 给 序列 号 值 加 1 两 
次 ， 然 后 在 第 二 个 进程 运行 第 36 步 前 存 入 一 个 值 为 7 的 序列 号 。 但 是 第 
二 个 进程 往 序 列 号 文件 号 入 的 值 却 为 6， 这 是 错误 的 。 

我 们 从 这 个 例子 中 看 到 的 是 ， 尽 管 强制 性 上 锁 阻 止 了 非 协作 进程 读 
一 个 已 被 锁 住 的 文件 〈 第 11 步 ) ， 但 是 仍 没有 解决 问题 。 问 题 出 在 当 碳 
边 的 进程 处 于 更 新 序列 号 的 三 个 步骤 〈 第 23、36 和 37 步 ) 期 间 时 ， 左 边 
的 进程 是 允许 更 新 序列 号 文件 的 《第 25 一 34 步 ) 。 如 果 有 多 个 进程 在 更 
新 一 个 文件 ， 那 么 所 有 进程 必须 使 用 某 种 上 锁 形 式 协 作 。 只 要 一 个 进程 
违规 就 可 能 引发 大 混乱 。 




















在 8.4 市 我 们 的 读 写 锁 实 现 中 ， 优 先 考虑 的 是 等 得 着 的 写 入 者 而 不 
是 等 待 着 的 读 出 者 。 现 在 看 看 由 fentl 记 录 上 锁 提 供 的 解决 读 出 者 与 写 入 
者 问题 的 办 法 的 某 些 细 市 。 我 们 想 看 到 的 是 ， 当 一 个 文件 区 已 被 锁 住 
时 ， 待 处 理 的 上 锁 请 求 是 如 何 处 理 的 ， 这 是 Posix 未 曾 说 明 的 。 











9.6.1 例子 : 东 个 写 入 锁 待 处理 期 间 的 额外 读 出 锁 

我 们 问 的 第 一 个 问题 是 : 如 果 茶 个 资源 已 经 读 锁 定 ， 并 有 一 个 写 入 
锁 请 求 在 等 待 处 理 ， 那 么 是 否 允 许 有 男 一 个 读 出 锁 ? 某 些 解决 读 出 者 与 
写 入 者 问题 的 办 法 不 允许 在 已 有 一 个 写 入 者 等 待 着 的 情况 下 再 增加 一 个 
读 出 者 ， 因 为 要 是 不 断 允许 新 的 读 出 请 求 的 话 ， 每 处 理 的 写 入 请 求 存在 
永远 不 被 允许 的 可 能 性 。 

为 测试 fcntl 记 录 上 锁 是 如 何 处 理 这 种 情形 的 ， 我 们 编写 一 个 测试 程 
序 ， 它 获取 茶 个 完整 文件 的 一 个 读 出 锁 ， 然 后 fork 两 个 子 进程 。 第 一 个 
子 进程 首先 尝试 获取 一 个 写 入 锁 〈 它 将 阻塞 ， 因 为 父 进程 已 持 有 整个 文 
件 的 一 个 读 出 锁 ) ， 然 后 由 第 二 个 进程 答 试 获取 一 个 读 出 锁 。 图 9-7 展 
示 了 这 些 请 求 的 时 间 线 图 ， 图 9-8 给 出 了 我 们 的 测试 程序 。 




















父 进程 子 进程 1 子 进程 2 


尝试 写 入 锁 
持 | 
有 | 
E | 
出 | - 
锁 1 取得 读 出 锁 
| 
| 
| 
放 


锁 


取得 写 入 锁 释放 锁 


时 间 
图 9-7 确定 有 一 个 写 入 锁 待 处 理 期 间 是 否 允许 有 另 一 个 读 出 锁 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

ai 

5 int fd; 

6 fd = Open("test1.data", O RDWR | O CREAT, FILE MODE); 

7 Read_lock (fd, 0, SEEK_SET, 0); /* parent read locks entire file */ 
8 printf ("%s: parent has read lock\n", Gf time()); 

9 if (Fork() == 0) { 

10 /* first child */ 

11 sleep (1); 

12 printf("$s: first child tries to obtain write lock\n", Gf time()); 
13 Writew lock(fd, 0, SEEK SET, 0); /* this should block */ 
14 printf("$s: first child obtains write lock\n", Gf time()); 
15 sleep (2); 

16 Un lock(fd, 0, SEEK SET, 0); 

17 printf("$s: first child releases write lock\n", Gf time()); 
18 exit(0); 

19 

20 if (Fork() == 0) { 

21 /* second child */ 

22 sleep (3); 

23 printf ("%s: second child tries to obtain read lock\n", Gf time()); 
24 Readw_lock(fd, 0, SEEK_SET, 0); 

25 printf ("%s: second child obtains read lock\n", Gf time()); 
26 sleep (4) ; 

27 Un_lock(fd, 0, SEEK_SET, 0); 

28 printf ("%s: second child releases read lock\n", Gf time()); 
29 exit (0) ; 

30 } 

31 /* parent */ 

32 sleep (5) ; 

33 Un lock(fd, 0, SEEK SET, 0); 

34 printf("$s: parent releases read lock\n", Gf time()); 

35 exit(0); 

36 ) 











图 9-8 确定 在 有 一 个 写 入 锁 待 处 理 期 间 是 否 允 许 有 另 一 个 读 出 锁 








父 进程 打开 文件 并 获取 读 出 锁 


6 一 8 
用 read_lock“〈 它 不 阻塞， 但 当 无 法 取得 锁 时 会 返回 一 个 错误 ) 而 不 是 
readw_lock〈 它 可 能 等 待 ) ， 因 为 预期 该 锁 会 立即 取得 。 当 取得 该 锁 
时 ， 和 输出 带 有 当前 时 间 的 一 个 消息 〈 使 用 UNPVl 第 404 页 的 gf_time 函 
TU . 


父 进程 打开 文件 ， 并 获取 整个 文件 的 读 出 锁 。 注 意 ， 





fork 第 一 个 子 进 程 


lock/test2.c 


lock/test2.c 


我 们 调 


9~19 ”创建 第 一 个 子 进程 ， 它 睡眠 1 秒 ， 然 后 阻塞 ， 等 待 整个 文件 
的 一 个 写 入 锁 。 当 取得 该 写 入 锁 时 ， 该 进程 持 有 它 2 秒 后 即 释 放 它 ， 然 
后 终止 。 

fork 第 二 个 子 进程 

20~30 创建 第 二 个 子 进程 ， 它 睡眠 3 秒 以 允许 第 一 个 子 进程 的 写 入 
锁 处 于 待 处 理 状 态 ， 然 后 党 试 获 取 整 个 文件 的 一 个 读 出 锁 。 到 时 候 我 们 
mt ie Fereadw_locki& lel AN 447th AB A8 241 

定 ， 该 读 出 锁 是 被 排 入 请 求 队 列 了 还 是 立即 给 予 了 。 该 锁 持 有 4 秒 
后 和 被 释放 。 

父 进程 持 有 读 出 锁 5 秒 

31—35 父 进 程 持 有 读 出 锁 5 秒 后 ， 释 放 该 锁 ， 然 后 终止 。 [4] 

图 9-7 所 示 的 时 间 线 图 是 我 们 在 Solaris 2.6. Digital Unix 4.0B 和 
BSD/OS 3.1 下 看 到 的 情形 。 也 就 是 说 ， 即 使 已 有 来 自 第 一 个 子 进程 的 一 
个 待 处 理 号 入 锁 请 求 ， 第 二 个 子 进程 请 求 的 读 出 锁 也 是 立即 给 予 的 。 这 
么 一 来 ， 只 要 连续 不 断 地 发 出 读 出 锁 请 求 ， 写 入 者 就 可 能 因 获 取 不 了 与 
入 锁 而 * 挨 饿 ?。 下 面 是 程序 的 输出 ， 我 们 在 大 的 时 间 事 件 之 间 插 入 些 空 
白 行 ， 以 改善 可 读 性 : 

alpha % test2 

16:32:29.674453: parent has read lock 

16:32:30.709197: first child tries to obtain write lock 16:32:32.725810: 





second child tries to obtain read lock 

16:32:32.728739: second child obtain read lock 

16:32:34.722282: parent releases read lock 16:32:36.729738: second 
child releases read lock 

16:32:36.735597: first child obtains write lock 

16:32:38.736938: first child releases write lock 

9.6.2 例子 : 等 待 着 的 写 入 者 是 否 比 等 竺 着 的 读 出 者 优先 

















我 们 问 的 下 一 个 问题 是 : 等 待 着 的 写 入 者 比 等 待 着 的 读 出 者 更 优先 
吗 ? 某 些 解决 读 出 者 与 写 入 者 问题 的 办 法 内 置 着 这 样 的 优先 关系 。 

图 9-9 是 我 们 的 测试 程序 ， 图 9-10 是 该 测试 程序 的 时 间 线 图 。 

父 进程 创建 文件 并 获取 写 入 锁 

6 一 8 父 进程 创建 一 个 文件 ， 并 获取 整个 文件 的 一 个 写 入 锁 。 

fork 第 一 个 子 进程 

9~19 ”派生 第 一 个 子 进程 ， 它 睡眠 1 秒 后 请 求 整 个 文件 的 一 个 写 入 
锁 。 我 们 知道 这 将 阻塞 ， 因 为 父 进程 已 获取 整个 文件 的 一 个 写 入 锁 并 且 
持 有 它 5 秒 ， 不 过 我 们 期 得 父 进程 持 有 的 锁 释 放 时 ， 本 请 求 已 排 入 队 。 

fork 第 二 个 子 进程 

20~30 派生 第 二 个 子 进程 ， 它 睡眠 3 秒 后 请 求 整个 文件 的 一 个 读 出 
锁 。 当 父 进程 释放 持 有 的 写 入 锁 时 ， 本 请 求 也 将 排 入 队 。 

在 Solaris 2.6 和 Digital Unix 4.0B 下 ， 我 们 看 到 第 一 个 子 进程 的 写 入 
锁 先 于 第 二 个 子 进 程 的 读 出 锁 取 得 ， 如 图 9-10 所 示 。 但 是 这 不 足以 告诉 
我 们 写 入 锁 比 读 出 锁 优 先 ， 因 为 其 原因 可 能 是 内 核 以 FIFO 顺 序 准 予 上 锁 
请 求 ， 而 不 管 它们 是 读 出 锁 还 是 写 入 锁 。 为 验证 之 ， 我 们 创建 另外 一 个 
与 图 9-9 几 乎 相同 的 测试 程序 ， 不 过 读 出 锁 请 求 是 在 第 1 秒 发 生 ， 写 入 锁 
请 求 是 在 第 3 秒 友 生 。 前 后 两 个 测试 程序 表明 ，Solaris 和 Digital Unix 
以 FIFO 顺 序 处 理 上 锁 请 求 的， 而 不 管 上 锁 请 求 的 类 型 。 这 两 个 程序 还 表 
明 ，BSD/OS 3.1 优 先 考虑 读 出 请 求 。 








lock/test3.c 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

& | 

5 int fd; 

6 fd = Open("test1.data", O_RDWR | O CREAT, FILE MODE); 

7 Write lock(fd, 0, SEEK SET, 0); /* parent write locks entire file */ 
8 printf("$s: parent has write lock\n", Gf time()); 

9 if (Fork() == 0) { 

10 /* first child */ 

qa sleep(1); 

12 printf("$s: first child tries to obtain write lock\n", Gf time()); 
13 Writew lock(fd, 0, SEEK SET, 0); /* this should block */ 
14 printf("$s: first child obtains write lock\n", Gf time()); 
15 sleep (2); 

16 Un lock(fd, 0, SEEK SET, 0); 

17 printf("$s: first child releases write lock\n", Gf time()); 
18 exit(0); 

19 ) 

20 if (Fork() == 0) ( 

21 /* second child */ 

22 sleep(3); 

23 printf("$s: second child tries to obtain read lock\n", Gf time()); 
24 Readw lock(fd, 0, SEEK SET, 0); 

25 printf("$s: second child obtains read lock\n", Gf time()); 
26 sleep (4) ; 

27 Un lock(fd, 0, SEEK SET, 0); 

28 printf("$s: second child releases read lock\n", Gf time()); 
29 exit(0); 

30 ) 

31 /* parent */ 

32 sleep(5); 

33 Un lock(fd, 0, SEEK SET, 0); 

34 printf("$s: parent releases write lock\n", Gf time()); 

35 exit (0); 

36 } 


lock/test3.c 





图 9-9 测试 写 入 者 是 否 比 读 出 者 优先 


下 面 是 图 9-9 中 程序 的 输出 ， 我 们 就 是 以 此 构造 出 图 9-10 所 示 的 时 间 
线 图 的 。 

alpha % test3 

16:34:02.810285: parent has write lock 

16:34:03.848166: first child tries to obtain write lock 

16:34:05.861082: second child tries to obtain read lock 





16:34:07.858393: parent releases write lock 
16:34:07.865222: first child obtains write lock 
16:34:09.865987: first child releases write lock 
16:34:09.872823: second child obtains read lock 
16:34:13.873822: secound child releases read lock 


时 间 
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图 9-10 测试 写 入 者 是 否 比 读 出 者 优先 
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记录 上 锁 的 一 个 常见 用 途 是 确保 某 个 程序 例如 守护 程序 〉 在 任何 
时 刻 只 有 一 个 副本 在 运行 。 图 9-11 给 出 了 一 个 守护 程序 启动 时 将 执行 的 
AER BE. 

打开 一 个 文件 并 为 其 上 锁 

8 一 17 “守护 进程 维护 一 个 只 有 1 行文 本 的 文件 ， 其 中 含有 它 的 进程 
ID。 它 打开 这 个 文件 ， 必 要 的 话 创建 之 ， 然 后 请 求 整个 文件 的 一 个 写 入 
锁 。 如 果 没 有 取得 该 锁 ， 我 们 就 知道 该 程序 有 另 一 个 副本 在 运行 ， 于 是 
输出 一 个 出 错 消 息 并 终止。 

许多 Unix 系 统 让 它们 的 守护 进程 把 各 自 的 进程 ID 写 到 一 个 文件 中 。 
Solaris 2.6 在 /etc 目 录 下 存放 了 其 中 一 些 文件 。Digital Unix 和 BSD/OS 则 
在 /varvrun 目 录 下 存放 这 些 文 件 。 

把 本 进程 PID 写 入 文件 

18~21 把 所 打开 的 文件 截 为 0， 然 后 写 入 含有 本 进程 PID 的 一 行文 
本 。 截 短 该 文件 的 原因 是 ， 该 程序 先前 的 副本 〈 壁 如 说 在 系统 重新 自 举 
前 执行 的 副本 ) 可 能 有 一 个 值 为 23456 的 进程 ID， 而 本 副本 的 进程 ID 为 
123。 要 是 光 写 入 那 一 行 而 不 预先 截 短 ， 那 么 文件 内 容 将 会 是 123\n6\n。 
尽管 第 一 行 仍然 含有 本 进程 的 进程 ID， 避 免 该 文件 中 出 现 第 二 行 的 可 能 
却 更 为 清晰 ， 更 不 易 引 起 混淆 。 


























lock/onedaemon.c 





1 #include "unpipc.h" 
2 #define PATH PIDFILE "pidfile" 
3 int 


4 main(int argc, char **argv) 


5 { 


6 int pidfd; 

7 char line [MAXLINE] ; 

8 /* open the PID file, create if nonexistent */ 

9 pidfd = Open (PATH PIDFILE, O RDWR | O CREAT, FILE MODE); 

10 /* try to write lock the entire file */ 

11 if (write lock(pidfd, 0, SEEK SET, 0) < 0) { 

12 if (errno == EACCES || errno == EAGAIN) 

13 err quit ("unable to lock %s, is $s already running?", 
14 PATH PIDFILE, argv[0]) ; 

15 else 

16 err sys("unable to lock %s", PATH _PIDFILE) ; 

17 } 

18 /* write my PID, leave file open to hold the write lock */ 
19 snprintf (line, sizeof (line), "%ld\n", (long) getpid()) ; 

20 Ftruncate(pidfd, 0); 

21 Write(pidfd, line, strlen(line)); 

22 /* then do whatever the daemon does ... */ 

23 pause () ; 

24 ) 


lock/onedaemon.c 





图 9-11 确保 某 个 程序 只 有 一 个 副本 在 运行 
下 面 是 图 9-11 中 程序 的 一 个 测试 结果 : 


solaris % onedaemon & 启动 第 一 个 副本 
solaris % cat pidfile 检查 写 入 文件 中 的 PID 
solaris % onedaemon 然后 尝试 启动 第 二 个 副 


[1] 22388 22388 

unable to lock pidfile,is onedaemon already running? 

一 个 守护 进程 还 有 其 他 方法 防止 自身 男 一 个 副本 启动 ， 壁 如 说 可 能 
使 用 信号 量 。 本 节 所 示 的 方法 的 优势 在 于 ， 许 多 守护 程序 都 编写 成 癌 茶 
个 文件 写 入 本 进程 ID， 而 且 如 果 茶 个 守护 进程 过 早 裔 淡 了 ， 那 么 内 核 会 
自动 释放 它 的 记录 锁 。 





9.8 5 gi 


Posix.1 保 证 ， 如 果 以 O_CREAT 〈 若 文件 不 存在 则 创建 它 ) 和 
O EXCL (独占 打开 ) 标志 调用 open 函 数 ， 那 么 一 旦 该 文件 已 经 存在 ， 
该 函数 就 返回 一 个 错误 。 而 且 考 虑 到 其 他 进程 的 存在 ， 检 查 该 文件 是 否 
存在 和 创建 该 文件 〈 如 果 它 还 不 存在 ) 必须 是 原子 的 。 因 此 ， 我 们 可 以 
把 以 这 种 技巧 创建 的 文件 作为 锁 使 用 。Posix.1 保 证 任何 时 候 只 有 一 个 进 
程 能 够 创建 这 样 的 文件 《〈 也 就 是 获取 锁 ) ， 释 放 这 样 的 锁 只 需 unlink 该 
SF 

图 9-12 给 出 了 使 用 这 种 技巧 的 上 锁 函 数 的 一 个 版 本 。 如 果 open 成 
功 ， 我 们 就 持 有 与 所 创建 文件 对 应 的 锁 ， 于 是 my_lock 函 数 可 以 返回 。 
返回 前 还 close 该 文件 ， 因 为 我 们 并 不 需要 它 的 描述 符 : 该 文件 的 存在 本 
号 代表 锁 ， 至 于 它 是 否 打开 则 无 关 紧 要 。 如 果 open 返 回 一 个 EEXIST 错 
误 ， 那 么 该 文件 已 经 存在 ， 于 是 我 们 再 次 尝试 open。 





lock/lockopen.c 





1 #include "unpipc.h" 

2 #define LOCKFILE "/tmp/seqno.lock" 

3 void 

4 my_lock(int fd) 

5 4 

6 int tempfd; 

7 while ( (tempfd = open(LOCKFILE, O RDWR|O CREAT|O EXCL, FILE MODE)) < 0){ 
8 if (errno != EEXIST) 

9 err_sys ("open error for lock file"); 

10 /* someone else has the lock, loop around and try again */ 

11 } 

12 Close (tempfd) ; /* opened the file, we have the lock */ 
13 ) 

14 void 

15 my unlock(int fd) 

16 ( 

27 Unlink (LOCKFILE); /* release lock by removing file */ 

18 } 





lock/lockopen.c 


图 9-12 使 用 指定 O_CREAT 和 O_EXCL 标 志 的 open 实 现 的 锁 函 数 


这 种 技巧 存在 以 下 三 个 问题 。 


(如 果 当 前 持 有 该 锁 的 进程 没有 释放 它 就 终止 ， 那 么 其 文件 名 并 未 
删除 。 对 付 这 个 问题 有 一 些 特 别 的 技巧 ， 例 如 检查 该 文件 的 最 近 访 问 时 
则 ， 如 果 它 有 一 段 大 于 某 个 确定 数量 的 时 间 未 曾 访 问 ， 那 就 假设 它 已 被 
遗忘 ， 不 过 这 些 技 巧 没 有 一 个 是 完善 的 。 男 一 个 技巧 是 把 持 有 该 锁 的 进 
程 的 进程 ID 写 入 其 锁 文 件 中 ， 这 样 其 他 进程 可 以 读 出 该 进程 ID， 并 检 碍 
该 进程 是 否 仍 在 运行 。 这 也 是 不 完善 的 ， 因 为 进程 ID 在 过 一 段 时 间 后 会 
被 重用 。 

这 种 情形 对 fcnd 记 录 上 锁 而 言 不 成 问题 ， 因 为 当 茶 个 进程 终止 时 ， 
由 它 持 有 的 任何 记录 锁 都 自动 释放 。 

(2) 如 果 另 外 茶 个 进程 已 打开 了 锁 文 件 ， 那 么 当前 进程 只 是 在 一 个 无 
限 循 环 中 一 次 又 一 次 地 调用 open。 这 称 为 轮 询 ， 是 对 CPU 时 间 的 一 种 浪 
费 。 一 种 蔡 换 技巧 是 sleep 1 秒 ， 然 后 再 次 尝试 open。 我们 在 图 7-5 中 看 
到 了 同样 的 问题 。) 

如 果 使 用 fcntl 记 录 上 锁 ， 这 就 不 成 问题 ， 前 提 是 想 要 持 有 该 锁 的 进 
程 指 定 FSETLKW 命 令 。 内 核 将 把 该 进程 投入 睡眠 ， 直 到 该 锁 可 用 ， 然 
后 唤醒 它 。 

(3) 调 用 open 和 unlink 创 建 和 删除 一 个 额外 的 文件 涉及 文件 系统 的 访 
问 ， 这 通 香 比 调用 fcntl 两 次 《一 次 用 于 获取 锁 ， 一 次 用 于 释放 锁 ) 所 花 
时 间 长 得 多 。 测 量 在 我 们 的 程序 中 给 序列 号 加 1 共 1000 次 的 循环 所 花 的 
执行 时 间 ， 发 现 fcntl 记 录 上 锁 比 调用 open 和 unlink 快 75 倍 。 

Unix 文 件 系统 的 另外 两 个 技巧 也 用 于 提供 特殊 的 上 锁 。 第 一 个 技巧 
是 : 如 果 新 链接 的 名 字 已 经 存在 ， 那 么 link 函 数 将 失败 。 为 获取 一 个 
锁 ， 首 先 创 建 一 个 唯一 的 临时 文件 ， 其 路 径 名 中 含有 调用 进程 的 进程 
ID《〈 如 果 不 同 进程 中 的 线程 间 以 及 同一 进程 内 的 线程 间 都 需要 上 人 锁 ， 那 
么 所 含 的 是 进程 ID 和 线程 ID 的 某 种 组 合 ) 。 然 后 以 待 建 立 锁 文 件 的 众 所 
周知 路 径 名 调用 link 函 数 创 建 这 个 临时 文件 的 一 个 链接 。 如 采 创 建成 
功 ， 该 临时 路 径 名 就 可 以 unlink 掉 。 当 调用 线程 使 用 完 该 锁 时 ， 只 需 

















unlink 其 众所周知 的 路 径 名 就 可 以 解锁 。 如 果 link 失 败 返 回 EEXIST 错 
误 ， 调 用 线程 就 得 重新 尝试 (类 似 于 图 9-12 中 的 做 法 ) 。 这 种 技巧 的 要 
求 之 一 是 : 临时 文件 路 径 名 和 锁 文 件 众所周知 的 路 径 名 必须 都 存在 于 同 
一 文件 系统 中 ， 因 为 多 数 版 本 的 Unix 不 允许 硬 链接 〈link 函 数 的 结果 ) 
跨越 不 同 的 文件 系统 。 

第 二 种 技巧 基于 : 如 果 待 打开 的 文件 已 经 存在 ， 打 开 时 指定 了 
O_TRUNC 标 志 ， 而 且 调 用 进程 不 具备 写 访问 权限 ， 那 么 open 调 用 将 返 
回 一 个 错误 。 为 获取 一 个 锁 ， 我 们 在 指定 
O_CREATIO_WRONLYIO_TRUNC 标 志 并 置 mode 参 数 为 0〈 即 新 文件 不 
打开 任何 权限 位 ) 的 前 提 下 调用 open。 如 果 调 用 成 功 ， 我 们 就 拥有 了 该 
锁 ， 以 后 使 用 完 该 锁 后 只 需 unlink 其 路 径 名 。 如 果 open 调 用 失败 返回 
EACCES 错 误 ， 那 么 调用 线程 必须 重新 尝试 (类 似 于 图 9-12 中 的 做 
法 ) 。 需 要 注意 的 是 ， 这 种 技巧 在 调用 线程 具备 超级 用 户 特 权时 不 起 作 
用 。 

从 这 些 例子 得 出 的 教训 是 应 该 使 用 fcntl 记 录 上 锁 。 然 而 你 有 可 能 
磅 到 使 用 这 些 老式 上 锁 技巧 的 代码 ， 它 们 通常 存在 于 fentl 上 锁 尚 未 广泛 
得 以 实现 之 前 编写 的 程序 中 。 




















9.9 NES Fi 


NFS 就 是 网 络 文件 系统 ， 它 在 TCPvl 第 29 章 中 讨论 。 作 为 对 NEFS 的 
一 种 扩展 ，NFS 的 大 多 数 实现 支持 fcntl 记 录 上 锁 。Unix 系 统 通常 以 两 个 
额外 的 守护 进程 支持 NFS 记 录 上 锁 ， 它 们 是 lockd 和 statd。 当 某 个 进程 调 
用 fcntl 以 获取 一 个 锁 ， 而 且 内 核 检 测 出 其 描述 符 引 用 通过 NFS 安 装 的 某 
个 文件 系统 上 的 一 个 文件 时 ， 本 地 的 lockd 就 向 服务 器 的 lockd 发 送 这 个 
请 求 。statd 守 护 进程 跟踪 着 持 有 锁 的 各 个 客户 ， 它 与 lockd 交 互 以 提供 
NFS 上 锁 的 崩 演 恢复 功能 


我 们 可 以 预期 NFS 文 件 的 记录 上 锁 比 本 地 文件 的 记录 上 锁 花 的 时 间 
长 ， 因 为 获取 与 释放 每 一 个 锁 都 需要 网 络 通信 。 为 测试 NFS 记 录 上 锁 ， 
我 们 只 需 修改 图 9-2 中 由 SEQFILE 指 定 的 文件 名 。 测 量 我 们 的 程序 使 用 
fcntl 记 录 上 锁 执 行 10 000 次 循环 所 需 的 时 间 ， 发 现 本 地 文件 的 记录 上 锁 
比 NFS 文 件 的 记录 上 锁 快 了 约 80 倍 。 还 要 留意 的 是 ， 当 序列 号 文件 在 某 
个 通过 NFS 安 装 的 文件 系统 上 时 ， 记 录 上 锁 和 序列 号 的 读 写 都 涉及 网 络 
通信 。 

防止 误解 的 说 明 : NFS 记 录 上 锁 多 年 来 一 直 是 个 问题 ， 它 差不多 是 
由 不 理想 的 实现 所 导致 的 。 尽 管 主 要 的 Unix 矿 家 已 最 终 清 理 了 它们 各 目 
的 实现 ， 通 过 NFS 使 用 fcntl 记 录 上 锁 对 于 许多 实现 来 说 仍然 是 一 个 严重 
的 问题 。 我 们 不 会 在 这 个 问题 上 偏 祖 一 方 而 贬低 男 一 方 ， 只 是 指出 fentl 
记录 上 锁 在 NFS 上 也 应 该 起 作用 ， 不 过 实际 成 功 与 否 取 决 于 实现 的 质 
量 ， 客 户 端 和 服务 器 并 部 有 质量 要 求 。 


9.10 小 结 


fcntl 记 录 上 锁 提供 了 对 一 个 文件 的 劝告 性 或 强制 性 上 锁 功 能 ， 而 我 
们 是 通过 该 文件 打开 着 的 描述 符 来 访问 它 的 。 这 些 锁 用 于 不 同 进程 间 的 
上 锁 ， 而 不 是 同一 进程 内 不 同 线 程 间 的 上 锁 。 术 语 “ 记 录 ” 是 个 不 确切 的 
名 字 ， 因 为 Unix 内 核 没 有 文件 内 记录 的 概念 。 更 好 的 称谓 是 “范围 上 锁 
(range locking) ”， 因 为 我 们 上 锁 或 解锁 的 是 文件 内 的 一 个 字 节 范围 。 
这 类 记录 上 锁 几 乎 都 用 作协 作 进 程 之 间 的 劝告 性 锁 ， 因 为 即使 是 强制 性 
上 锁 也 会 导致 不 一 致 的 数据 ， 正 如 我 们 所 示 。 

使 用 fcnti 记 录 上 锁 时 ， 等 待 着 的 读 出 者 优先 还 是 等 待 着 的 写 入 者 优 
先 没 有 保证 ， 这 也 是 我 们 在 第 8 草 中 看 到 过 的 读 写 锁 的 情形 。 如 果 这 对 
于 某 个 应 用 来 说 很 重要 ， 那 就 编写 并 运行 9.6 市 中 开发 的 类 似 测 试 程 
序 ， 或 者 给 该 应 用 提供 满足 所 需 优先 关系 的 专用 读 写 锁 实现 (如 我 们 在 





























8.4 节 所 做 的 那样 ) 。 
习题 


9.1 从 图 9-2 和 图 9-1 构 造 locknone 程 序 ， 在 自己 的 系统 上 运行 多 次 。 
验证 这 个 没有 任何 上 锁 能 力 的 程序 工作 不 正确 ， 而 且 结果 是 非 确定 的 。 

9.2 把 图 9-2 中 的 程序 修改 成 不 对 标准 输出 进行 缓冲 。 这 样 的 修改 有 
什么 效果 ? 

9.3 ”继续 上 一 道 习 题 ， 这 次 改 为 调用 putchar 逐 个 输出 字符 ， 而 不 是 
调用 printt。 这 样 的 修改 有 什么 效果 ? 

9.4 把 图 9-3 中 my_lock 函 数 使 用 的 写 入 锁 改 为 读 出 锁 。 会 发 生 什 
A? 

9.5 把 loopmain.c 程 序 中 的 open 调 用 改 为 同时 指定 O_NONBLOCK 标 
志 。 构 造 1oopfcntlnonb 程 序 ， 同 时 运行 它 的 两 个 实例 。 结 果 有 什么 变化 
uU? 为 什么 ? 

9.6 继续 上 一 道 习 题 ， 这 次 使 用 非 阻 堵 版 本 的 loopmain.c 构 造 
loopnonenonb 程 序 〈 使 用 locknone.c 文 件 ， 它 不 进行 上 锁 操 作 ) 。 启 用 
seqgno 文 件 的 强制 性 上 锁 。 同 时 运行 本 程序 的 一 个 实例 以 及 来 自 上 一 道 
习题 的 loopfcntinonb 程 序 的 一 个 实例 。 会 发 生 什么 ? 

9.7 构造 loopfcntl 程 序 ， 从 某 个 shell 脚 本 在 后 台 运 行 它 10 次 。 这 10 个 
实例 的 每 一 个 应 指定 一 个 值 为 10 000 的 命令 行 参数 。 首 先 在 使 用 劝告 性 
上 锁 的 前 提 下 给 这 个 shell 脚 本 计时 ， 然 后 把 seqno 文 件 的 权限 改 为 局 用 
强制 性 上 锁 。 强 制 性 上 锁 对 性 能 有 什么 影响 ? 

9.8 在 图 9-8 和 图 9-9 中 ， 我 们 为 什么 调用 fork 创 建 子 进程 ， 而 不 是 调 
用 pthread_create 创 建 线程 ? 

9.9 在 图 9-11 中 ， 我 们 调用 ftruncate 把 文件 的 大 小 置 为 0 字 节 。 为 什 
么 不 改 为 简单 地 给 open 指 定 O_TRUNC 标 志 ? 








9.10 如 果 我 们 要 编写 一 个 使 用 fcntl 记 录 上 锁 的 线程 化 应 用 程序 ， 那 
么 在 指定 上 锁 的 起 始 字 节 偏 移 量 时 ， 应 使 用 SEEK_SET、SEEK_CUR 还 
是 SEEK_END 呢 ?为 什么 ? 





第 10 = Posix(= 5 Œ 


10.1 概述 


信号 量 (semaphore) 是 一 种 用 于 提供 不 同 进程 间或 一 个 给 定 进程 
的 不 同 线程 间 同 步 手段 的 原 语 。 本 书 讨论 三 种 类 型 的 信号 量 。 

Posix 有 名 信号 量 : 使 用 Posix IPC 名 字 (2.2 节 ) 标识 ， 可 用 于 进程 
或 线程 间 的 同步 。 

Posix 基 于 内 存 的 信号 量 : 存放 在 共享 内 存 区 中 ， 可 用 于 进程 或 线 
程 间 的 同步 。 

System V 信 号 量 〈 第 11 章 ) : 在 内 核 中 维护 ， 可 用 于 进程 或 线程 间 
的 同步 。 

我 们 暂时 只 考虑 不 同 进程 间 的 同步 。 首 先 考 虑 二 ae 
semaphore) : 其 值 或 为 0 或 为 1 的 信号 量 。 图 10-1 展 示 了 这 种 信和 号 





























进程 A 进程 B 


创建 、 等 待 和 挂 出 
信号 量 的 函数 

















图 10-1 由 两 个 进程 使 用 的 一 个 二 值 信号 量 

图 中 男 出 该 信号 量 是 由 内 核 来 维护 的 《这 对 于 System V 信 和 号 量 是 正 
确 的 ) ， 其 值 可 以 是 0 或 1。 

Posix 信 与 量 不 必 在 内 核 中 维护 。 为 外 ，Posix 信 与 量 是 由 可 能 与 文 

















件 系统 中 的 路 径 名 对 应 的 名 字 来 标识 的 。 因 此 ， 图 10-2 是 Posix 有 名 信和 号 
量 的 更 为 实际 的 图 示 。 


创建 、 等 待 和 挂 出 
eet. geen eet 言 号 量 的 函数 
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容 或 为 0 或 为 1 的 文件 


图 10-2 由 两 个 进程 使 用 的 一 个 Posix 有 名 二 值 信号 量 


pace 












































我 们 必须 就 图 10-2 作 一 个 限定 : 尽管 Posix 有 名 信和 号 量 是 由 可 能 与 文 
件 系统 中 的 路 径 对 应 的 名 字 来 标识 的 ， 但 是 并 不 要 求 它 们 真正 存放 在 文 
件 系 统 内 的 某 个 文件 中 。 举 例 来 说 ， 髓 入 式 实时 系统 可 能 使 用 这 样 的 名 
字 来 标识 信号 量 ， 但 是 真正 的 信号 量 值 却 存放 在 内 核 中 的 茶 个 地 方 。 然 
而 ， 如 果 信 号 量 的 实现 用 到 了 映射 文件 (我 们 将 在 10.15 市 展示 这 样 的 
一 个 实现 ) ， 那 么 信号 量 的 真正 值 确实 出 现在 某 个 文件 中 ， 而 该 文件 是 
映射 到 所 有 让 该 信号 量 打开 着 的 进程 的 地 址 空间 的 。 

在 图 10-1 和 图 10-2 中 ， 我 们 注 出 了 一 个 进程 可 以 在 茶 个 信号 量 上 执 
行 的 三 种 操作 。 

(1) 创 建 (create) 一 个 信号 量 。 这 还 要 求 调 用 者 指定 初始 值 ， 对 于 
二 值 信号 量 来 说 ， 它 通常 是 1， 但 也 可 以 是 0。 

(2) 等 待 〈wait) 一 个 信号 量 。 该 操作 会 测试 会 这 个 信号 量 的 值 ， 如 
果 其 值 小 于 或 等 于 0， 那 就 等 待 〈 阻 塞 )》， 一 旦 其 值 变 为 大 于 0 就 将 它 减 
1。 这 个 过 程 可 以 用 如 下 的 伪 代 码 来 总 结 : 

while (semaphore value <= 0) 

/* wait; i.e.,block the thread or process */ 




















semaphore_value--; 

/* we have the semaphore */ 

这 里 的 基本 要 求 是 : 考虑 到 访问 同一 信号 量 的 其 他 线程 或 进程 ， 在 
while 语 句 中 测试 该 信号 量 的 值 和 其 后 将 它 减 1 (如果 该 值 大 于 0〉 这 两 
个 步骤 必须 作为 一 个 原子 操作 完成 。 〈 这 是 20 世 纪 80 年 代 中 期 System V 
言 号 量 在 内 核 中 实现 的 原因 之 一 。 这 样 一 来 信号 量 操作 成 为 内 核 中 的 系 
统 调用 ， 于 是 保证 相对 其 他 进程 的 原子 性 变 得 容易 起 来 。) 

本 操作 还 有 其 他 常用 名 字 : 最 初 Edsger Dijkstra 称 它 为 P 操 作 ， 代 表 
集 兰 语 单词 proberen (意思 是 尝试 ) 。 它 也 称 为 递减 (down， 因 为 信号 
量 的 值 被 减 掉 1) 或 上 锁 Clock) ， 不 过 我 们 使 用 Posix 术 语 等 待 
(wait) 。 

(3) 挂 出 (post) 一 个 信号 量 。 该 操作 将 信号 量 的 值 加 1， 可 以 用 如 
RE TATRA SRE ZG 

semaphore_value++; 

如 果 有 一 些 进 程 阻 塞 着 等 待 该 信号 量 的 值 变 为 大 于 0， 其 中 一 个 进 
程 现在 就 可 能 被 唤醒 。 与 刚刚 给 出 的 等 待 伪 代 码 一 样 ， 考 虑 到 访问 同一 
言 写 量 的 其 他 进程 ， 挂 出 操作 也 必须 是 原子 的 。 

本 操作 还 有 其 他 常用 名 字 : 最 初 称 为 V 操 作 ， 代 表 和 荷兰 语 蛙 词 
verhogen (意思 是 增加 〉 。 它 也 称 为 递增 (up， 因 为 信号 量 的 值 被 加 上 
1) 、 解 锁 Cunlock) 或 发 信号 (signal) 。 我 们 使 用 Posix 术 语 挂 出 
(post) 。 

显而易见 ， 真 正 的 信号 量 代码 比 我 们 给 出 的 等 竺 和 挂 出 操作 的 伪 代 
码 有 更 多 的 细节 ， 也 就 是 如 何 将 等 待 茶 个 给 定 信号 量 的 所 有 进程 排队 ， 
然后 如 何 唤醒 一 个 “可 能 是 很 多 进程 中 的 一 个 ) 正在 等 待 某 个 给 定 信和 号 
量 被 挂 出 的 进程 。 所 圣 的 是 这 些 细节 是 由 实现 来 处 理 的 。 

注意 ， 上 面 给 出 的 伪 代 码 并 没有 假定 使 用 其 值 仅 为 0 或 1 的 二 值 信和 号 
量 。 它 们 适用 于 其 值 初始 化 为 任意 非 负 值 的 信号 量 。 这 样 的 信号 量 称 为 



































计数 信号 量 (counting semaphore) 。 计 数 信 号 量 通 常 初 始 化 为 某 个 值 
N， 指 示 可 用 的 资源 〈 璧 如 说 缓冲 区 ) 数 。 本 章 我 们 将 同时 展示 二 值 信 
号 量 和 计数 信号 量 的 例子 。 
我 们 往往 在 二 值 信号 量 和 计数 信号 量 之 间 进 行 区 分 ， 这 样 做 是 为 了 
我 们 自己 的 教导 目的 。 在 实现 信号 量 的 代码 中 ， 这 两 者 间 并 没有 差别 。 
二 值 信 号 量 可 用 于 互 斥 目的 ， 束 像 互 斥 锁 一 样 。 图 10-3 给 出 了 一 个 
例子 。 








初始 化 互 斥 锁 ; 初始 化 信号 量 为 1; 
pthread mutex lock(&mutex); sem wait(&sem); 
临界 区 临界 区 
pthread_mutex_unlock (&mutex) ; sem_post (&sem) ; 


图 10-3 比较 解决 互 斥 问题 的 互 斥 锁 和 信和 号 量 

我 们 把 信号 量 初始 化 为 1，sem_wait 调 用 等 待 其 值 变 为 大 于 0， 然 后 
将 它 减 1，sem_post 调 用 则 将 其 值 加 1《〈 从 0 变 为 1) ， 然 后 唤醒 阻塞 在 
sem_wait 调 用 中 等 待 该 信号 量 的 任何 线程 。 

除 可 以 像 互 斥 锁 那 样 使 用 外 ， 信 和 号 量 还 有 一 个 互 斥 锁 没 有 提供 的 特 
性 : 互 斥 锁 必 须 总 是 由 

222 锁 住 它 的 线程 解锁 ， 信 和 号 量 的 挂 出 却 不 必 由 执 行 过 它 的 等 待 操 
作 的 同一 线程 执行 。 我 们 可 以 使 用 两 个 二 值 信号 量 和 第 7 章 中 生产 者 - 消 
费 者 问题 的 一 个 简化 版 本 提供 展示 这 种 特性 的 一 个 例子 。 图 10-4 展 示 了 
往 某 个 共享 缓冲 区 中 放置 一 个 条 目的 一 个 生产 者 以 及 取 走 该 条 目的 一 个 
消费 者 。 为 简单 起 见 ， 假 设 该 缓冲 区 只 容纳 一 个 条 目 。 





生产 者 消费 者 























图 10-4 使 用 一 个 共 主 缓冲 区 的 简单 生产 者 -消费 者 问题 














图 10-5 给 出 了 生产 者 和 消费 者 程序 的 伪 代 码 。 


生产 者 消费 者 
把 信号 量 get 初 始 化 为 0; 
把 信号 量 put 初 始 化 为 1; 





ou ae 
sem_wait (&put) ; sem_wait (&get) ; 
把 数据 放 入 缓冲 区 处 理 缓冲 区 中 的 数据 
sem post (&get) ; sem post (&put) ; 
} } 





图 10-5 简单 的 生产 者 -消费 者 程序 的 伪 代 码 

信号 量 put 控 制 生 产 者 是 否 可 以 往 共享 缓冲 区 中 放置 一 个 条 目 ， 信 
号 量 get 控 制 消 费 者 是 人 否 可 以 从 共享 缓冲 区 中 取 走 一 个 条 目 。 按 时 间 顺 
序 发 生 的 步骤 如 下 所 述 。 

(1) 生 产 者 初始 化 绥 冲 区 和 两 个 信号 量 。 

(2) 假 设 消费 者 接着 运行 。 它 阻塞 在 sem_wait 调 用 中 ， 因 为 get 的 值 
为 0。 

(3) 一 段 时 间 后 生产 者 接着 运行 。 当 它 调 用 sem_wait 后 ，put 的 值 由 1 
减 为 0， 于 是 生产 者 往 缓冲 区 中 放置 一 个 条 目 ， 然 后 它 调用 sem_post， 

把 get 的 值 由 0 增 为 1。 既 然 有 一 个 线程 《 即 消 费 者 ) 阻塞 在 该 信号 量 上 
等 待 其 值 变 为 正 数 ， 访 线程 将 被 标记 成 准备 好 运行 (ready_to_run) 。 

但 是 假设 生产 者 继续 运行 ， 生 产 者 随后 会 阻 罕 在 for 循 环 项 部 的 sem_wait 
调用 中 ， 因 为 put 的 值 为 0。 生 产 者 必须 等 待 到 消费 者 腾空 缓冲 区 。 

(4) 消 费 者 从 sem_wait 调 用 中 返回 ， 它 将 get 信 号 量 的 值 由 1 减 为 0。 
接着 它 会 处 理 绥 冲 区 中 的 数据 ， 然 后 调用 sem_post， 把 put 的 值 由 0 增 为 
1。 既 然 有 一 个 线程 (生产 者 ) 阻 赛 在 该 信号 量 上 等 竺 其 值 变 为 正 数 ， 
该 线程 将 被 标记 成 准备 好 运行 。 但 是 假设 消费 者 继续 运行 ， 消 费 者 随后 
会 阻塞 在 for 循 环 顶部 的 sem_wait 调 用 中 ， 因 为 get 的 值 为 0。 




















(5) 生 产 者 从 sem_wait 调 用 中 返回 ， 于 是 把 数据 放 入 缓冲 区 中 ， 上 述 
情形 循环 继续 。 

我 们 假设 每 次 调用 sem_post 时 ， 即 使 当时 有 一 个 进程 正在 等 每 并 随 
后 被 标记 成 准备 好 运行 ， 调 用 者 也 继续 运行 。 是 调用 者 继续 运行 还 是 刚 
变 成 准备 好 状态 的 线程 运行 无 天 紧要 你 应 该 假设 对 立 的 情形 ， 并 说 服 
目 己 接受 这 个 事实 ) 。 

下 面 列 出 信号 量 、 互 斥 锁 和 条 件 变量 之 间 的 三 个 差异 。 

(1) 互 斥 锁 必须 总 是 由 给 它 上 锁 的 线程 解锁 ， 信 号 量 的 挂 出 却 不 必 由 
执行 过 它 的 等 待 操作 的 同一 线程 执行 。 这 是 我 们 的 例子 刚 展示 过 的 。 

(2) 互 斥 锁 要 么 被 锁 住 ， 要 么 被 解 开 〈 二 值 状态 ， 类 似 于 二 值 信号 
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(3) 既 然 信 号 量 有 一 个 与 之 关联 的 状态 ( 它 的 计数 值 )， 那 么 信号 量 
挂 出 操作 总 是 被 记 住 。 然 而 当 问 一 个 条 件 变 量 发 送信 号 时 ， 如 果 没 有 线 
程 等 得 在 该 条 件 变 量 上 ， 那 么 该 信号 将 丢失 。 作 为 这 种 特性 的 一 个 例 
子 ， 考 虑 图 10-5， 不 过 假设 第 一 次 通过 生产 者 的 循环 时 ， 消 费 者 还 没有 
调用 sem_wait。 生 产 者 仍 可 以 往 缓冲 区 放置 数据 条 目 ， 然 后 在 get 信 号 量 
上 调用 sem_post( 把 它 的 值 由 0 增 为 1 ) ， 接 着 阻 塞 在 put 信 号 量 上 的 
sem_wait 调 用 中 。 一 段 时 间 以 后 ， 消 费 者 可 能 进入 它 的 for 循 环 ， 在 get 
信号 量 上 调用 sem_wait， 其 结 末 是 将 该 信号 量 的 值 减 1〈 由 1 减 为 0) , 
于 是 消费 者 接着 处 理 缓冲 区 。 

Posix.1 基 本 原理 一 文 声称 ， 有 了 互 斥 锁 和 条 件 变量 还 提供 信和 号 量 的 
原因 是 : “本 标准 提供 信号 量 的 主要 目的 是 提供 一 种 进程 间 同 步 方式 。 
这 些 进 程 可 能 共享 也 可 能 不 共 吾 内 存 区 。 互 斥 锁 和 条 件 变量 是 作为 线程 
间 的 同步 机 制 说 明 的 ， 这 些 线程 总 是 共享 CES) 内 存 区 。 这 两 者 都 是 
已 广泛 使 用 了 多 年 的 同步 范式 。 每 组 原 语 都 特别 适合 于 特定 的 问 
题 。” 我 们 将 在 10.15 节 看 到 ， 使 用 互 斥 锁 和 条 件 变量 实现 具有 随 内 核 持 
续 性 的 计数 信号 量 需要 约 300 行 C 代 码 ， 应 用 程序 不 应 该 各 自从 头 编写 这 









































300 行 C 代 码 。 尽 管 信 号 量 的 意图 在 于 进程 间 同 步 ， 互 斥 锁 和 条 件 变 量 的 
意图 则 在 于 线程 间 同 步 ， 但 是 信号 量 也 可 用 于 线程 间 ， 互 斥 锁 和 条 件 变 
量 也 可 用 于 进程 间 。 我 们 应 该 使 用 适合 具体 应 用 的 那 组 原 语 。 

我 们 提 到 过 Posix 提 供 两 类 信号 量 : 有 名 (named) 信号 量 和 基于 内 
存 的 《memory-based)〉 的 信号 量 ， 后 者 也 称 为 无 名 (unnamed) 信号 
量 。 图 10-6 比 较 了 这 两 类 信和 与 量 使 用 的 函数 。 
































有 名 信号 量 基于 内 存 的 信号 量 
sem_open () sem_init () 
sem wait () 


sem trywait () 
sem post () 
sem getvalue() 


sem close () sem destroy () 
sem unlink() 


图 10-6 用 于 Posix 信 和 号 量 的 函数 调用 


图 10-2 展 示 了 一 个 Posix 有 名 信号 量 。 图 10-7 则 展示 了 某 个 进程 内 由 
两 个 线程 共享 的 一 个 Posix 基 于 内 存 的 信号 量 。 
































图 10-7 由 一 个 进程 内 的 两 个 线程 共享 的 基于 内 存 的 信号 量 

图 10-8 展 示 了 某 个 共享 内 存 区 《第 四 部 分 ) 中 由 两 个 进程 共享 的 一 

个 Posix 基 于 内 存 的 信号 量 。 图 中 男 出 该 共享 内 存 区 同时 属于 这 两 个 进 
程 的 地 址 空间 。 
































LITER 22.1--------2 - “一 个 进程 | 





图 10-8 由 两 个 进程 共享 、 处 于 共享 内 存 区 中 的 基于 内 存 的 信号 量 


本 章 中 我 们 首先 讲述 Posix 有 名 信号 量 ， 然 后 讲述 Posix 基 于 内 存 的 
言 号 量 。 我 们 回 到 7.3 节 中 的 生产 者 -消费 者 问题 ， 将 它 扩展 成 允许 多 个 
生产 者 和 一 个 消费 者 ， 最 后 是 多 个 生产 者 和 多 个 消费 者 。 我 们 然后 指 
出 ， 多 个 缓冲 区 的 常用 WO 技巧 只 是 生产 者 -消费 者 问题 的 一 个 特例 。 








我 们 给 出 Posiz 有 名 信号 量 的 三 种 实现 ; 第 一 种 实现 使 用 FIFO， 第 
二 种 实现 使 用 内 存 映 射 7O 以 及 互 斥 锁 和 条 件 变量 ， 第 三 种 实现 使 用 


System V 信 和 号 量 。 


10.2 sem open. sem closefilsem unlink;£ 2 


半数 sem_open 创 建 一 个 新 的 有 名 信号 量 或 打开 一 个 已 存在 的 有 名 信 
量 。 有 名 信号 量 总 是 既 可 用 于 线程 间 的 同步 ， 又 可 用 于 进程 间 的 同 




















SE aia 


#include <semaphore.h> 
sem t *sem open(const char *name, int oflag,... 
/* mode t mode,unsigned int value */ ); 
返回 : AOA SEE A A 
SEM_FAILED 
我 们 已 在 2.2 节 中 描述 过 有 关 name 参 数 的 规则 。 
oflag 参 数 可 以 是 0、O_CREAT 或 O_CREAT|IO_EXCL， 如 2.3 节 所 
述 。 如 果 指 定 了 O_CREAT 标 志 ， 那 么 第 三 个 和 第 四 个 参数 是 需要 的 : 
其 中 mode 参 数 指 定 权 限 位 〈 图 2-4) ，value 参 数 指定 信号 量 的 初始 值 。 
该 初始 值 不 能 超过 SEM_VALUE_MAX (这 个 常 值 必须 至 少 为 
32767) 。 二 值 信号 量 的 初始 值 通常 为 1， 计 数 信号 量 的 初始 值 则 往往 大 
于 1。 
如 果 指 定 了 O_CREAT〔 而 没有 指定 O_EXCL) ， 那 么 只 有 当 所 需 
的 信号 量 尚未 存在 时 才 初 始 化 它 。 不 过 所 需 信 号 量 已 存在 条 件 下 指定 
O_CREAT 并 不 是 一 个 错误 。 访 标志 的 意思 仅仅 是 “如 果 所 需 信号 量 尚 未 
存在 ， 那 就 创建 并 初始 化 它 ”。 但 是 所 需 信 号 量 已 存在 条 件 下 指定 
O_CREAT |O_EXCL 却 是 一 个 错误 。 
sem_open 的 返回 值 是 指向 某 个 sem_t 数 据 类 型 的 指针 。 该 指针 随后 





























用 作 sem_close、sem_wait、sem_trywait、sem_post 以 及 sem_getvalue 的 
参数 。 

用 SEM_FAILED 这 个 返回 值 来 指示 错误 比较 奇怪 。 使 用 空 指针 也 许 
en ee 使 用 -1 这 个 返回 值 
来 指示 出 错 ， 许 多 实现 于 是 定义 

#define SEM_FAILED ((sem_t *)(-1)) 

当 使 用 sem_open 创 建 或 打开 某 个 信号 量 时 ，Posix.1 未 就 与 该 信号 量 
关联 的 权限 位 做 过 多 少 说 明 。 实 际 上 从 图 2-3 和 前 面 的 讨论 可 注意 到 ， 
当 打 开 一 个 有 名 信和 号 量 时 ， 我 们 甚至 没有 在 oflag 参 数 中 指定 
O RDONLY. O WRONLYZ&O RDWR 标 志 。 本 书 中 的 例子 所 用 的 两 

个 系统 (Digital Unix 4.0B 和 Solaris 2.6) 都 要 求 对 某 个 已 存在 的 信号 量 
上 其 有 读 访 问 和 写 访 问 权 限 ， 这 

样 对 它 的 sem_open 才 能 成 功 。 其 原因 也 许 是 信号 量 的 挂 出 与 等 待 操 
作 都 需要 读 出 并 修改 信号 量 的 值 。 这 两 种 实现 上 ， 不 具备 读 访问 或 写 访 
问 某 个 已 存在 信号 量 的 权限 都 将 导致 sem_open 函 数 返回 一 个 EACCES 错 
IR (“Permission denied (访问 权限 不 符 )”) 。 

使 用 sem_open 打 开 的 有 名 信号 量 ， 使 用 sem_close 将 其 关闭 。 


#include <semaphore.h> 




















int sem_close(sem_t *sem); 
返回 : 大 成 功 则 为 0， 寿 出 错 则 为 -1 

一 个 进程 终止 时 ， 内 核 还 对 其 上 仍然 打开 着 的 所 有 有 名 信号 量 目 动 
执行 这 样 的 信号 量 关 闭 操作 。 不 论 该 进程 是 自愿 终止 的 〈 通 过 调用 exit 
s exi) 还 是 非 上 自愿 地 终止 的 〈 通 过 辐 它 发 送 一 个 Unix 信 号 ) » APA 
动 关闭 都 会 发 生 。 

关闭 一 个 信号 量 并 没有 将 它 从 系统 中 删除 。 这 融 是 说 ，Posix 有 名 
言 写 量 人 至 少 是 随 内 核 持续 的 : 即使 当前 没有 进程 打开 着 某 个 信号 量 ， 它 
的 值 仍然 保持 。 





























有 名 信号 量 使 用 sem_unlink 从 系统 中 删除 。 

#include <semaphore.h> 

int sem_unlink(const char *name); 

返回 : ERKI, Asa A-1 

EM a Ss A AP SI Fh a oe SST RA ORC — 
FÉ) ，sem_unlink 类 似 于 文件 IO 的 unlink 函 数 : 当 引 用 计数 还 是 大 于 0 
时 ，name 就 能 从 文件 系统 中 删除 ， 然 而 其 信号 量 的 析 构 《不 同 于 将 它 的 
名 字 从 文件 系统 中 删除 ) 却 要 等 到 最 后 一 个 sem_close 发 生 时 为 止 。 


10.3 sem wait 和 sem trywait[| 数 


sem_wait 函 数 测试 所 指定 信号 量 的 值 ， 如 有 果 该 值 大 于 0， 那 就 将 它 
减 1 并 立即 返回 。 如 果 该 值 等 于 0， 调 用 线程 就 被 投入 睡眠 中 ， 直 到 该 值 
变 为 大 于 0， 这 时 再 将 它 减 1， 函 数 随 后 返回 。 我 们 以 前 提 到 过 ， 考 碟 到 
访问 同一 信号 量 的 其 他 线程 , “测试 并 减 世 操作 必须 是 原子 的 。 

#include <semaphore.h> 
int sem_wait(sem_t *sem); 
int sem_trywait(sem_t *sem); 

均 返 回 : AWA, AEEA- 
sem_wait 和 sem_trywait 的 差别 是 : 当 所 指定 信号 量 的 值 已 经 是 0 
后 者 并 不 将 调用 线程 投入 睡眠 。 相 反 ， 它 返回 一 个 EAGAIN 错 误 。 
如 果 被 某 个 信号 中 断 ，sem_wait 就 可 能 过 早 地 返回 ， 所 返回 的 错误 
为 EINTR。 


时 


-> 





10.4 sem_post#llsem_getvalue pk Zi 


当 一 个 线程 使 用 完 某 个 信号 量 时 ， 它 应 该 调用 sem_post。 就 像 10.1 
节 中 讨论 过 的 那样 ， 本 函数 把 所 指定 信号 量 的 值 加 1， 然 后 唤醒 正在 等 














待 该 信号 量 值 变 为 正 数 的 任意 线程 。 

#include <semaphore.h> 

int sem_post(sem_t *sem); 

int sem_getvalue(sem_t *sem,int *valp); 

BRI: ARIO, Æ hA- 

sem_getvalue 在 由 valp 指 同 的 整数 中 返回 所 指定 信号 量 的 当前 值 。 
如 果 该 信号 量 当前 已 上 锁 ， 那 么 返回 值 或 为 0， 或 为 采 个 负数 ， 其 绝对 
值 就 是 等 待 该 信号 量 解锁 的 线程 数 。 

我 们 现在 看 到 了 互 斥 锁 、 条 件 变 量 和 信和 号 量 之 间 的 更 多 差别 。 首 
先 ， 互 斥 锁 必 须 总 是 由 给 它 上 锁 的 线程 解锁 。 信 号 量 没 有 这 种 限制 : 一 
个 线程 可 以 等 待 茶 个 给 定 信号 量 〈 璧 如 说 将 该 信号 量 的 值 由 1 减 为 0， 这 
跟 给 该 信号 量 上 锁 一 样 ) ， 而 另 一 个 线程 可 以 挂 出 该 信号 量 《〈 璧 如 说 将 
该 信号 量 的 值 由 0 增 为 1， 这 跟 给 该 信号 量 解锁 一 样 ) 。 

其 次 ， 既 然 每 个 信号 量 有 一 个 与 之 关联 的 值 ， 它 由 挂 出 操作 加 1， 
由 等 竺 操作 减 1， 那 么 任何 线程 都 可 以 挂 出 一 个 信号 〈 璧 如 说 将 它 的 值 
由 0 增 为 1) ， 即 使 当时 没有 线程 在 等 待 该 信号 量 值 变 为 正 数 也 没有 天 
系 。 然 而 ， 如 果 某 个 线程 调用 了 pthread_cond_signal， 不 过 当时 没有 任 
何 线程 阻塞 在 pthread_cond_wait 调 用 中 ， 那 么 发 往 相 应 条 件 变 量 的 信和 号 
KER 

最 后 ， 在 各 种 各 样 的 同步 技巧 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 信 和 号 
t) 中 ， 能 够 从 信号 处 理 程序 中 安全 调用 的 唯一 函数 是 sem_post。 

这 三 个 差异 点 不 应 该 被 解释 成 作者 对 于 信号 量 的 俩 祖 。 我 们 已 看 过 
的 所 有 同步 原 语 〈 互 斥 锁 、 条 件 变量 、 读 写 锁 、 信 和 号 量 以 及 记录 上 锁 ) 
都 有 它们 各 目的 位 置 。 对 于 一 个 给 定 应 用 我 们 已 有 很 多 选择 ， 因 而 需要 
了 解 各 种 原 语 之 间 的 差别 。 还 要 从 刚刚 列 出 的 比较 中 意识 到 的 是 ， 互 斥 
锁 是 为 上 锁 而 优化 的 ， 条 件 变量 是 为 等 竺 而 优化 的 ， 信 号 量 既 可 用 于 上 
锁 ， 也 可 用 于 等 待 ， 因 而 可 能 导致 更 多 的 开销 和 更 高 的 复杂 性 。 



























































10.5 简单 的 程 


我 们 现在 提供 一 些 在 Posix 有 名 信号 量 上 操作 的 简单 程序 ， 目 的 是 
更 多 地 了 解 它们 的 功能 与 实现 。 由 于 Posixzx 有 名 信和 号 量 至 少 具 有 随 内 核 
的 持续 性 ， 因 此 我 们 可 以 路 多 个 程序 操纵 它们 。 

10.5.1 semcreate 程 序 

图 10-9 中 的 程序 创建 一 个 有 名 信号 量 ， 人 允许 的 命令 行 选项 有 指定 独 
占 创 建 的 -e 和 指定 一 个 初始 值 〈 默 认 值 1 以 外 的 值 〉 的 -i。 








pxsem/semcreate.c 














1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 { 
5 int c, flags; 
6 sem t *sem; 
7 unsigned int value; 
8 flags - O RDWR | O CREAT; 
9 value - 1; 
图 10-9 创建 一 个 有 名 信号 量 
10 while ( (c = Getopt(argc, argv, "ei:")) !- -1) { 
gu switch (c) ( 
12 case 'e': 
r3 flags |= O_EXCL; 
14 break; 
15 case 'i': 
16 value = atoi(optarg) ; 
17 break; 
18 ) 
19 } 
20 if (optind != argc - 1) 
21 err quit ("usage: semcreate [ -e ] [ -i initalvalue ] <name>"); 
22 sem - Sem open(argv[optind], flags, FILE MODE, value); 
23 Sem close (sem) ; 
24 exit (0); 
25 ) 


pxsem/semcreate.c 





图 10-9 (5D 


22 既然 总 是 指定 O_CREAT 标 志 ， 我 们 调用 sem_open 时 必须 提供 四 
个 参数 。 不 过 最 后 两 个 参数 只 有 所 需 信号 量 尚 未 存在 时 才 由 sem_open 使 
用 。 














关闭 信号 量 

23 ”我 们 调用 sem_close， 不 过 要 是 省 挥 了 这 个 调用 ， 当 相应 进程 终 
止 时 ， 所 创建 的 信号 量 也 被 关闭 (所 占用 的 系统 资源 随 之 释放 ) 。 

10.5.2 semunlink 程 序 

图 10-10 中 的 程序 删除 一 个 有 名 信号 量 的 名 字 。 





pxsem/semunlink.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 { 
if (argc != 2) 
err quit ("usage: semunlink <name>"); 


Sem_unlink (argv [1]) ; 


io œ - Ou 


exit (0); 





pxsem/semunlink.c 








图 10-10 删除 一 个 有 名 信和 号 量 的 名 字 

















10.5.3 semgetvalue 程 序 

图 10-11 中 的 简单 程序 打开 一 个 有 名 信号 量 ， 取 得 它 的 当前 值 ， 然 
后 输出 该 值 。 

打开 信号 量 

9 当 我 们 去 打开 一 个 一 定 存 在 的 信号 量 时 ，sem_open 的 第 二 个 参数 
为 0， 因 为 我 们 不 指定 O_CREAT， 也 没有 其 他 O_xxx 常 值 需 指定 。 








pxsem/semgetvalue.c 








pxsem/semgetvalue.c 





1 include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 sem t *sem; 

6 int val; 

7 if (argc != 2) 

8 err quit("usage: semgetvalue <name>") ; 
9 sem - Sem open(argv[1], 0); 

10 Sem getvalue(sem, &val); 

1d printf ("value = %d\n", val); 

12 exit (0); 
T3 j} 

图 10-11 取得 并 输出 一 个 信号 量 的 值 
eT 
10.5.4 semwaitfz 


图 10-12 中 的 程序 打开 一 个 有 名 信号 量 ， 调 用 sem_wait( 如果 该 信号 





量 的 当前 值 小 于 或 等 于 0， 该 调用 惑 阻 暑 ， 纤 
的 值 减 1) 
调用 中 。 


取得 并 输出 该 信号 量 的 当前 值 ， 


吉 束 阻塞 后 该 调用 将 信号 量 
然后 永远 阻塞 在 一 个 pause 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

E 

5 sem t *sem; 

6 int val; 

7 if (argc l= 2) 

8 err quit("usage: semwait «name»"); 
9 sem - Sem open(argv[1], 0); 

10 Sem wait (sem); 

11 Sem getvalue(sem, &val); 

12 printf ("pid %ld has semaphore, value = %d\n", 
13 pause () ; 
14 exit (0); 
15 } 


pxsem/semwait.c 


(long) getpid(), val); 


/* blocks until killed */ 











pxsem/semwait.c 


图 10-12 等 待 一 个 信号 量 并 输出 它 的 值 


10.5.5 sempost 程 序 
图 10-13 中 的 程序 挂 出 一 个 有 名 信号 量 〈 即 把 它 的 值 加 1〉， 然 后 取 
得 并 输出 该 信号 量 的 值 。 


pxsem/sempost.c 





1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 sem t *sem; 

6 int val; 

T if (argc != 2) 

8 err quit("usage: sempost <name>") ; 
9 sem - Sem open(argv[1], 0); 

10 Sem post (sem) ; 

T4. Sem getvalue(sem, &val); 

12 printf ("value = %d\n", val); 

13 exit (0); 

14 } 


pxsem/sempost.c 





图 10-13 挂 出 一 个 信号 量 


10.5.6 例子 
我 们 首先 在 Digital Unix 4.0B 下 创建 一 个 有 名 信号 量 ， 然 后 输出 它 的 
(上 默认) fü. 

alpha % semcreate /tmp/test1 

alpha 96 ls -l /tmp/test1 

-rw-r--r-- 1 rstevens system 264 Nov 13 08:51 /tmp/test1 alpha 
2% semgetvalue /tmp/test1 

value = 1 

跟 Posix 消 息 队 列 一 样 ， 本 系统 创建 一 个 位 于 文件 系统 中 的 文件 ， 
它 对 应 于 我 们 给 所 创建 的 有 名 信和 号 量 指定 的 名 字 。 

现在 等 待 该 信号 量 ， 然 后 中 止 持 有 该 信号 量 锁 的 程序 。 

alpha % semwait /tmp/test1 

pid 9702 has semaphore, value = 0 sem_wait 返 回 后 的 值 











A? 键入 中 断 键 
以 中 止 程序 

value = 0 值 仍 然 为 0 
alpha % semgetvalue /tmp/test1 

本 例子 展示 了 我 们 早先 提 到 过 的 两 个 特性 。 首 先 ， 信 号 量 的 值 是 随 
内 核 持续 的 。 这 就 是 说 ， 从 上 一 个 例子 创建 该 信号 量 到 本 例子 ， 尺 管 期 
间 没 有 程序 打开 着 该 信号 量 ， 其 值 〈 等 于 1) 却 由 内 核 维持 着 。 其 次 ， 
当 我 们 中 止 持 有 信号 量 锁 的 semwait 程 序 时 ， 该 信号 量 的 值 并 不 改变 。 
这 就 是 说 ， 当 持 有 某 个 信号 量 锁 的 进程 没有 释放 它 就 终止 时 ， 内 核 并 不 
给 该 信号 量 解锁 。 这 跟 记 录 锁 不 一 样 ， 我 们 在 第 9 草 中 说 过 ， 当 持 有 某 
个 记录 锁 的 进程 没有 释放 它 束 终止 时 ， 内 核 和 目 动 释放 它 。 

我 们 接着 展示 Digital Unix 的 信号 量 实现 使 用 负 的 信号 量 值 指示 等 符 
该 信号 量 解锁 的 进程 数 。 














value = 0 值 仍然 是 来 自 
上 一 个 例子 的 0 

alpha % semwait /tmp/testl & 定局 全 启动 下 
semwait 程 序 

[1] 9718 它 阻塞 ， 等 待 
信号 量 

value = -1 有 一 个 进程 在 
等 竺 信号 量 

alpha % semwait /tmp/testl & 在 后 台 局 动 另 一 个 
semwait 程 序 


alpha % semgetvalue /tmp/test1 
alpha % semgetvalue /tmp/test1 
[2] 9727 它 也 阻塞 ， 等 


value = -2 有 两 个 进程 在 


等 待 信号 量 

alpha % sempost /tmp/test1 现在 挂 出 信号 量 

value = -1 sem_postik [Hl Ja 
的 值 

pid 9718 has semaphore,value = -1 来 目 第 一 个 semwait 程 序 
的 输出 

alpha % sempost /tmp/test1 再 次 挂 出 信号 量 

pid 9727 has semaphore,value = 0 来 自 第 二 个 semwait 程 序 
的 输出 


alpha % semgetvalue /tmp/test1 
value = 0 
当 信 号 量 值 为 -2 时 ， 我 们 执行 sSempost 程 序 ， 于 是 该 值 经 加 1 后 变 为 
-1， 同 时 有 一 个 原本 阻塞 在 sem_wait 调 用 中 的 进程 返回 。 
现在 改 为 在 Solaris ”2.6 下 执行 同样 的 例子 ， 目 的 是 查看 它们 在 信和 号 
量 实现 上 的 差异 。 


solaris % semcreate /test2 











solaris % Is -] /tmp/.*test2* 

-rw-r--r-- 1 rstevens other1 48 Nov 13 09:11 /tmp/.SEMDtest2 

-TW-TW-TW- 1 rstevens  other1 0 Nov 13 09:11 
/tmp/.SEMLtest2 solaris 96 semgetvalue / test2 

value 7 1 

跟 Posix 消 息 队 列 一 样 ，Solaris 系 统 在 /tmp 目 录 下 创建 若干 文件 ， 作 
为 文件 名 后 弘 的 是 所 指定 信号 量 的 名 字 。 我 们 看 到 第 一 个 文件 的 权限 与 
我 们 调用 sem_open 时 指定 的 权限 相对 应 ， 至 于 第 二 个 文件 ， 我 们 猜想 其 
ATED 

下 面 验证 当 持 有 某 个 信号 量 锁 的 进程 没有 释放 该 锁 就 终止 时 ， 内 核 

















没有 上 自动 挂 出 该 信号 量 。 
solaris % semwait /test2 
pid 4133 has semaphore,value = 0 
^? 
value = 0 


solaris % semgetvalue /test2 








SEA P TBE 
值 仍 然 为 0 








接 独 展示 Solaris 的 信号 量 实现 在 有 进程 等 待 着 共 个 信号 量 的 时 候 如 


何 处 理 该 信号 量 的 值 。 
solaris % semgetvalue /test2 
value = 0 
上 一 个 例子 的 0 
solaris % semwait /test2 & 
semwait 程 序 
[1] 4257 


solaris % semwait /test2 & 
semwait 程 序 

value = 0 
不 过 有 两 个 进程 在 等 着 

solaris % sempost /test2 

pid 4257 has semaphore,value = 0 
的 输出 

pid 4263 has semaphore,value = 0 
的 输出 solaris 96 semgetvalue /test2 

[2] 4263 





值 仍 然 是 来 目 


在 后 台 局 动 一 个 


Hx, bid 


本 实现 不 使 用 


fEJc & SI 


值 仍 然 为 0， 


现在 挂 出 信号 量 
来 自 第 一 个 semwait 程 序 


来 自 第 二 个 semwait 程 序 


solaris % semgetvalue /test2 

value = 0 

solaris % sempost /test2 

value = 0 

与 前 面 在 Digital Unix 下 的 输出 相 比 ， 这 个 输出 中 的 一 个 差别 是 在 挂 
出 信号 量 的 时 机 : 看 起 来 等 待 着 的 进程 优 于 挂 出 信号 量 的 进程 运行 。 


10.6 生产 者 一 消费 者 问题 

















我 们 在 7.3 市 中 讲述 了 生产 者 -消费 者 问题 ， 并 展示 了 一 些 解决 方 
案 ， 具 体 解决 多 个 生产 者 线程 填写 由 单个 消费 者 线程 处 理 的 一 个 数组 时 
的 同步 问题 。 

(了 1) 在 第 一 个 方 采 中 “(7.3 市 ) ， 消 费 者 是 在 生产 者 完成 后 局 动 的 ， 
因此 使 用 单个 互 斥 锁 〈 来 同步 各 个 生产 者 ) 就 能 解决 同步 问题 。 

(2) 在 下 一 个 方案 中 《〈7.5 节 ) ， 消 费 者 在 生产 者 完成 之 前 局 动 ， 因 
此 解决 同步 问题 需要 一 个 互 斥 锁 〈 来 同步 各 个 生产 者 ) 加 上 一 个 条 件 变 
量 及 其 互 斥 锁 《〈 来 同步 生产 者 和 消费 者 ) 。 

现在 对 生产 者 -消费 者 问题 进行 扩展 ， 把 共享 缓冲 区 用 作 一 个 环绕 
缓冲 区 : 生产 者 填写 最 后 一 项 (buff[NBUFF-1])〉 后 ， 回 过 头 来 填写 第 
一 项 (buff[0]〉， 消 费 者 也 同样 这 么 做 。 这 么 一 来 增加 了 又 一 个 同步 问 
题 ， 即 生产 者 不 能 走 到 消费 者 的 前 面 。 我 们 仍然 假设 生产 者 和 消费 者 都 
征 线程 ， 不 过 它们 也 可 以 是 进程 ， 前 提 是 存在 菜 种 在 进程 间 共 孚 缓冲 区 
的 方法 “例如 我 们 将 在 第 四 部 分 介绍 的 共 孚 内 存 区 ) 。 
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三 个 条 件 。 


() 当 绥 冲 区 为 空 时 ， 消 费 者 不 能 试图 从 其 中 去 除 一 个 条 目 。 
(2) 当 绥 冲 区 填 满 时 ， 生 产 者 不 能 试图 往 其 中 放置 一 个 条 目 。 





























(3) 共 至 变量 可 能 描述 缓冲 区 的 当前 状态 (下 标 、 计 数 和 链表 指针 
等 ) ， 因 此 生产 者 和 消费 者 的 所 有 缓冲 区 操纵 都 必须 保护 起 来 ， 以 避免 
SE HAS e 

接 下 来 我 们 给 出 的 使 用 信号 量 的 方案 展示 了 三 种 不 同类 型 的 信号 








量 。 

(名 为 mutex 的 二 值 信号 量 保护 两 个 临界 区 : 一 个 是 往 共 享 缓冲 区 
中 插入 一 个 数据 条 目 〈( 由 生产 者 执行 )， 男 一 个 是 从 共享 缓冲 区 中 移 走 
ce 目 〈 由 消费 者 执行 ) 。 用 作 互 斥 锁 的 二 值 信号 量 初始 化 为 
1。《〈 显 然 ， 我 们 可 以 使 用 真正 的 互 斥 锁 代 蔡 这 样 的 二 值 信 号 量 。 见 习 
a 10. ) (2) 名 为 nempty 的 计数 信号 量 统计 共享 缓冲 区 中 的 空 槽 位 
数 。 访 信号 量 初始 化 为 缓冲 区 中 的 槽 位 数 CNBUFF) 。 

(3) 名 为 nstored 的 计数 信号 量 统计 共享 缓冲 区 中 已 填写 的 权 位 数 。 
信号 量 初始 化 为 0， 因 为 缓冲 区 一 开始 是 空 的 。 

图 10-14 展 示 了 程序 完成 初始 化 时 我 们 的 缓冲 区 及 两 个 计数 信号 量 
的 状态 。 我 们 给 未 用 的 数组 元 素 标 以 阴影 。 
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buff [NBUFF-1] : 


nempty: 


nstored: 





图 10-14 初始 化 后 的 缓冲 区 和 两 个 计数 信号 量 


在 我 们 的 例子 中 ， 生 产 者 只 是 把 0~~(NLOOP-1) 存 放 到 共享 缓冲 区 
H Cbuff[0] = 0，buff[1]= 1， 等 等 ) ， 并 把 该 缓冲 区 用 作 一 个 环绕 缓冲 
区 。 消 费 者 从 该 缓冲 区 取出 这 些 整数 ， 并 验证 它们 是 正确 的 ， 若 有 错误 
则 输出 到 标准 输出 上 。 

图 10-15 展 示 了 在 生产 者 往 共 享 缓冲 区 放置 了 3 个 条 目 之 后 ， 但 在 消 
息 者 从 该 缓冲 区 取 走 其 中 任何 条 目 之 前 该 缓冲 区 和 两 个 计数 信号 量 的 状 
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buff [2] : 


buff [3] : 





buff [NBUFF-1] : 


nempty: NBUFF-3 


图 10-15 生产 者 放置 3 个 条 目 到 缓冲 区 后 的 缓冲 区 和 计数 信号 量 


我 们 接着 假设 消费 者 从 共享 缓冲 区 中 移 走 一 个 条 目 ， 图 10-16 展 示 
这 时 的 状态 。 


EERUN : 一 > 消费 者 从 缓冲 区 
buff [1] : 移 走 1 个 条 目 
butt [2] : 

buff [3] : 


buff [NBUFF-1] : 





nempty: 





nstored: 
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图 10-16 消费 者 从 缓冲 区 移 走 第 一 个 条 目 后 的 缓冲 区 和 计数 信号 量 

图 10-17 中 的 main 函 数 创建 前 述 三 个 信号 量 ， 创 建 两 个 线程 ， 等 待 
这 两 个 线程 的 完成 ， 然 后 删除 这 些 信和 号 量 。 

全 局 变量 

6 一 10 可 存放 NBUFF 个 条 目的 缓冲 区 以 及 三 个 信号 量 指针 是 生产 者 
线程 和 消费 者 线程 共享 的 全 局 变量 。 正 如 第 7 章 中 所 述 ， 我 们 把 它们 收 
集 到 一 个 结构 中 ， 以 强调 这 些 信 号 量 是 用 于 同步 对 共享 缓冲 区 的 访问 
的 。 

创建 信号 量 

19 一 25 创建 三 个 信号 量 ， 它 们 的 名 字 首 先 传递 给 我 们 的 
px_ipc_name 函 数 。 指 定 O_EXCL 标 志 ， 因 为 每 个 信号 量 都 需要 初始 化 
为 正确 的 值 。 如 果 这 三 个 信号 量 因 先 前 本 程序 运行 中 止 而 没有 全 部 删 


























除 ， 那 么 我 们 可 以 在 创建 之 前 给 每 个 信号 量 调用 sem_unlink， 并 忽略 任 
何 错误 。 男 一 种 方法 是 ， 检 查 指定 了 O_EXCL 标 志 的 sem_open 是 否 返 回 
一 个 EEXIST 错 误 ， 若 是 则 调用 sem_unlink， 然 后 再 调用 一 次 sem_open， 

不 过 这 人 么 一 来 就 更 复杂 了 。 如 果 我 们 需要 验证 本 程序 只 有 一 个 副本 在 运 
行 “ 这 一 步 可 在 尝试 创建 任何 信号 量 之 前 完成 )， 那 么 可 以 如 9.7 布 中 

所 述 的 那样 去 做 。 











pxsem/prodcons1.c 
1 #include "unpipc.h" 


2 #define NBUFF 10 

3 #define SEM MUTEX "mutex" /* these are args to px ipc name() */ 
4 #define SEM NEMPTY  "nempty" 

5 #define SEM NSTORED "nstored" 


6 int nitems; /* read-only by producer and consumer */ 

7 struct: ( /* data shared by producer and consumer */ 
8 int buff [NBUFF] ; 

9 sem t *mutex, *nempty, *nstored; 

10 } shared; 


11 void *produce (void *), *consume(void *) ; 

12 int 

13 main(int argc, char **argv) 

14 { 

15 pthread t tid produce, tid consume; 

16 if (argc !- 2) 

17 err quit ("usage: prodconsl <#items>") ; 

18 nitems = atoi (argv[11); 

19 /* create three semaphores */ 

20 Shared.mutex - Sem open(Px ipc name(SEM MUTEX), O CREAT | O EXCL, 
21 FILE MODE, 1); 

22 Shared.nempty - Sem open(Px ipc name(SEM NEMPTY), O CREAT | O EXCL, 
23 FILE MODE, NBUFF); 

24 shared.nstored - Sem open(Px ipc name(SEM NSTORED), O CREAT | O EXCL, 
25 FILE MODE, 0); 

26 /* create one producer thread and one consumer thread */ 

27 Set concurrency (2); 

28 Pthread create(&tid produce, NULL, produce, NULL); 

29 Pthread create(&tid consume, NULL, consume, NULL); 

30 /* wait for the two threads */ 

31 Pthread join(tid produce, NULL); 

32 Pthread join(tid consume, NULL); 

33 /* remove the semaphores */ 

34 Sem unlink(Px ipc name (SEM MUTEX)); 

35 Sem unlink(Px ipc name(SEM NEMPTY)); 

36 Sem unlink(Px ipc name(SEM NSTORED)); 

37 exit (0); 

38 } 


pxsem/prodcons 1.c 





图 10-17 生产 者 一 消费 者 问题 信号 量 解决 方案 的 main 函 数 


创建 两 个 线程 

26~29 ”创建 两 个 线程 ， 一 个 作为 生产 者 ， 一 个 作为 消费 者 。 不 给 
这 两 个 线程 传递 任何 参数 。 

30—36 ”主线 程 然 后 等 竺 这 两 个 线程 的 终止 ， 接 着 删除 一 开始 创建 





的 三 个 信号 量 。 

我 们 还 可 以 给 每 个 线程 调用 sem_close， 不 过 进程 终止 时 这 会 自动 发 
生 。 然 而 删除 一 个 有 名 信和 号 量 的 名 字 却 必须 显 式 地 完成 。 

图 10-18 给 出 了 produce 和 comsume 函 数 。 


pxsem/prodcons l.c 





39 void * 
40 produce (void *arg) 


41 ( 

42 int i; 

43 for (i = 0; i < nitems; i++) { 

44 Sem_wait (shared.nempty) ; /* wait for at least 1 empty slot */ 
45 Sem_wait (shared.mutex) ; 

46 shared.buff[i % NBUFF] = i; /* store i into circular buffer */ 
47 Sem_post (shared.mutex) ; 

48 Sem_post (shared.nstored) ; /* 1 more stored item */ 

49 } 

50 return (NULL) ; 

51 

52 void * 

53 consume (void *arg) 

54 

55 int ve 

56 for (i = 0; i < nitems; i++) { 

57 Sem_wait (shared.nstored) ; /* wait for at least 1 stored item */ 
58 Sem_wait (shared.mutex) ; 

59 if (shared.buff[i % NBUFF] != i) 

60 printf ("buff[%d] = d\n", i, shared.buff[i % NBUFF]); 

61 Sem_post (shared.mutex) ; 

62 Sem_post (shared.nempty) ; /* 1 more empty slot */ 

63 } 

64 return (NULL) ; 

65 } 





pxsem/prodcons l.c 


10-18 produce 和 consume 函 数 


生产 者 等 待 到 绥 冲 区 中 有 一 个 条 目的 空间 

44 生产 者 在 nempty 信 号 量 上 调用 sem_wait， 等 待 缓冲 区 中 有 存放 另 
一 个 条 目的 可 用 空间 为 止 。 首 次 执行 本 行 语句 时 ， 该 信号 量 的 值 将 从 
NBUFF 变 为 NBUFF-1。 

生产 者 在 缓冲 区 中 存放 条 目 

45~48 在 往 缓 冲 区 中 存放 新 条 目 之 前 ， 生 产 者 必须 获取 mutex 信 号 
量 。 在 我 们 的 例子 中 ， 生 产 者 只 是 往 下 标 为 1 % NBUFF 的 数组 元 素 中 存 





放 一 个 值 ， 因 此 不 需要 描述 缓冲 区 状态 的 共享 变量 eese Utd 
用 每 次 往 缓冲 区 中 放置 一 个 条 目 就 得 更 新 状态 的 链表 ) 。 这 样 的 话 ， 获 
取 和 释放 mutex 信 号 量 实际 上 没有 必要 。 不 过 我 们 还 是 给 出 了 ， 因 为 这 
种 类 型 的 问题 (更 新 由 多 个 线程 共享 的 一 个 缓冲 区 ) 通常 需要 这 人 么 做 。 

往 缓 冲 区 中 存放 当前 条 目 后 ， 释 放 mutex 信 号 量 〈 其 值 由 0 变 为 
1) ， 并 挂 出 nstored 信 号 量 。 第 一 次 执行 这 个 语句 时 ，nstored 的 值 将 从 
初始 值 0 变 为 1。 

消费 者 等 待 nstored 信 号 量 

57—62 当 nstored 信 号 量 的 值 大 于 0 时 ， 绥 冲 区 中 己 有 那么 多 的 条 目 
竺 处理 。 消 费 者 从 绥 冲 区 

死 锁 中 取出 一 个 条 目 并 验证 它 的 值 是 正确 的 ， 不 过 这 样 的 缓冲 区 访 
问 是 用 mutex guis cod 之 后 消费 者 挂 出 nempty 信 号 量 ， 人 告诉 
生产 者 又 有 一 个 空 覃 位 可 用 了 。 

Dual mn. 费 者 函数 〈 图 10-18) 中 两 个 Sem_wait 调 
用 的 顺序 ， 那 会 发 生 什 么 呢 ? 假设 生产 者 首先 启动 〈 跟 习题 10.1 的 解答 
中 所 假设 的 一 样 ，， 那 么 它 将 往 绥 冲 区 中 存放 NBUFF 个 条 目 ， 从 而 把 
nempty 信 号 量 的 值 从 NBUFF 递 减 为 0， 把 nstored 信 号 量 的 值 从 0 递增 为 
NBUFF。 至 此 ， 生 产 者 阻塞 在 Sem_wait(shared.nempty) 调 用 中 ， 因 为 组 
冲 区 满 ， 其 上 没有 存放 另 一 个 条 目的 空 槽 位 可 用 。 

消费 者 启动 ， 验 证 绥 冲 区 中 第 一 批 NBUFF 个 条 目的 正确 性 。 这 个 
过 程 把 nstored 信 号 量 的 值 从 NBUFF 递 减 为 0， 把 nempty 信 号 量 的 值 从 0 递 
增 为 NBUFF。 消 费 者 接着 在 调用 Sem_wait ” (shared.mutex) 之 后 阻塞 在 
Sem_wait(shared.nstored) 调 用 中 。 生 产 者 可 以 恢复 执行 了 ， 因 为 nempty 
的 值 现 已 大 于 0， 然 而 生产 者 接着 调用 的 是 Sem_wait(shared.mutex)， 于 
是 阻塞 。 

这 种 现象 就 是 死 锁 (dead lock) . e Glues oi 号 量 ， 但 
是 消费 者 却 持 有 该 信号 量 并 在 等 待 nstored 信 号 量 。 然 而 生产 者 只 有 获取 
































了 mnutex 信 号 量 才能 挂 出 nstored 信 号 量 。 这 就 是 使 用 信号 量 的 问题 之 
S 要 是 编写 代码 时 出 了 差错 ， 程 序 就 不 能 正确 工作 。 
Posix 人 允许 sem_wait 检 测 死 锁 并 返回 EDEADLK 错 误 ， 但 是 运行 本 例 
子 所 用 的 系统 (Solaris 2.6 和 Digital Unix 4.0B) 都 不 能 检测 这 种 错误 。 


10.7 文件 上 锁 


现在 回 到 第 9 章 中 的 序列 写 问 题 ， 我 们 提供 了 使 用 Posix 有 名 信号 量 
实现 的 my_lock 和 my_unlock 函 数 。 网 10-19 给 出 了 这 两 个 函数 。 

















lock/lockpxsem.c 





1 #include "unpipc.h" 


2 #define LOCK PATH "pxsemlock" 


3 sem t *locksem; 
4 int initflag; 
5 void 


6 my lock(int fd) 


8 if (initflag -- O) ( 
9 locksem - Sem open(Px ipc name(LOCK PATH), O CREAT, FILE MODE, 1); 
10 initflag - 1; 
11 } 
12 Sem_wait (locksem) ; 
13 3J 
14 void 
15 my_unlock (int fd) 
16 { 
17 Sem_post (locksem) ; 
18 } 


lock/lockpxsem.c 





图 10-19 使 用 Posix 有 名 信号 量 的 文件 上 锁 
这 两 个 函数 采用 一 个 作为 劝告 性 文件 锁 使 用 的 信号 量 ， 当 首先 调用 
my_lock 函 数 时 ， 该 信号 量 的 值 被 初始 化 为 1。 为 获取 该 文件 锁 ， 我 们 调 
用 sem_wait; 为 释放 该 锁 ， 我 们 调用 sem_post。 


10.8 sem_init 和 sem_destroy 函 数 


本 章 此 前 的 内 容 处 理 的 是 Posix 有 名 信号 量 。 这 些 信 和 号 量 由 一 -人 











name 参 数 标 识 ， 它 通常 指 代 文 件 系统 中 的 某 个 文件 。 然 而 Posix 也 提供 
基于 内 存 的 信号 量 ， 它 们 由 应 用 程序 分 配 信号 量 的 内 存 空 间 《〈 也 就 是 分 
配 一 个 sem_t 数 据 类 型 的 内 存 空间 ) ， 然 后 由 系统 初始 化 它们 的 值 。 


#include <semaphore.h> 








int sem_init(sem_t *sem,int shared,unsigned int value); 
返回 : 知 出 错 则 为 -1 
int sem_destroy(sem_t *sem); 
返回 : ERIO, a BEENA- 

基于 内 存 的 信号 量 是 由 sem_init 初 始 化 的 。sem 参 数 指 癌 应 用 程序 必 
须 分 配 的 sem_t 变 量 。 如 果 shared 为 0， 那 么 待 初始 化 的 信号 量 是 在 同一 
进程 的 各 个 线程 间 共 享 的 ， 人 否则 该 信号 量 是 在 进程 间 共 享 的 。 当 shared 
为 非 零 时 ， 该 信号 量 必须 存放 在 某 种 类 型 的 共享 内 存 区 中 ， 而 即将 使 用 
它 的 所 有 进程 都 要 能 访问 该 共享 内 存 区 。 跟 sem_open 一 样 ，value 参 数 
是 该 信号 量 的 初始 值 。 

使 用 完 一 个 基于 内 存 的 信号 量 后 ， 我 们 调用 sem_destroy 摧 毁 它 。 

sem_open 不 需要 类 似 于 shared 的 参数 或 类 似 于 
PTHREAD_PROCESS_SHARED 的 属性 (第 7 章 中 讲述 的 互 斥 锁 和 条 件 
变量 可 使 用 该 属性 ) ， 因 为 有 名 信号 量 总 是 可 以 在 不 同 进程 间 共 享 的 。 

注意 ， 基 于 内 存 的 信号 量 不 使 用 任何 类 似 于 O_CREAT 标 志 的 东 
西 ， 也 就 是 说 ，sem_init 总 是 初始 化 信号 量 的 值 。 因 此 ， 对 于 一 个 给 定 
的 信号 量 ， 我 们 必须 小 心 保 证 只 调用 sem_init 一 次 。“〈 习 题 10.2 展 示 了 对 
于 有 名 信和 号 量 的 这 个 差别 。) 对 一 个 已 初始 化 过 的 信和 号 量 调用 
sem_init， 其 结果 是 未 定义 的 。 

你 得 确保 理解 sm_open 和 sem_init 之 间 的 下 述 基 本 差异 。 前 者 返回 
一 个 指 同 菜 个 sem_t 变 量 的 指针 ， 该 变量 由 〈sem_open) 函数 本 身分 配 
并 初始 化 。 后 者 的 第 一 个 参数 是 一 个 指 癌 茶 个 sem_t 变 量 的 指针 ， 该 变 
量 由 调用 者 分 配 ， 然 后 由 Csem iniO 函数 初始 化 。 





















































Posix.1 警 告 说 ， 对 于 一 个 基于 内 存 的 信号 量 ， 只 有 sem_init 的 sem 参 
数 指 同 的 位 置 可 用 于 访问 该 信号 量 ， 使 用 它 的 sem_t 数 据 类 型 副本 访问 
时 结果 未 定义 。 

sem_init 出 错时 返回 -1， 但 成 功 时 并 不 返回 0。 这 确实 有 些 奇怪 ， 
Posix.1 基 本 原理 一 文中 有 一 个 注解 说 ， 将 来 的 某 个 修订 版 可 能 指定 调用 
成 功 时 返回 0。 

当 不 需要 使 用 与 有 名 信和 号 量 关 联 的 名 字 时 ， 可 改 用 基于 内 存 的 信和 号 
。 彼 此 无 亲缘 关系 的 不 同 进程 需 使 用 信号 量 时 ， 通 第 使 用 有 名 信和 号 
。 其 名 字 就 是 各 个 进程 标识 信号 量 的 手段 。 

我 们 在 图 1-3 中 说 过 ， 基 于 内 存 的 信号 量 人 至 少 具有 随 进 程 的 持续 
性 ， 然 而 它们 真正 的 持续 性 却 取决 于 存放 信号 量 的 内 存 区 的 类 型 。 只 要 
含有 某 个 基于 内 存 信 号 量 的 内 存 区 保持 有 效 ， 该 信号 量 就 一 直 存 在。 

如 果 某 个 基于 内 存 的 信号 量 是 由 单个 进程 内 的 各 个 线程 共享 的 
Csem_init 的 shared 的 参数 为 0) ， 那 么 该 信号 量具 有 随 进 程 的 持续 性 ， 
当 该 进程 终止 时 它 也 消失 。 

如 果 某 个 基于 内 存 的 信号 量 是 在 不 同 进程 间 共 享 的 〈sem_init 的 
shared 参 数 为 1) ， 那 么 该 信号 量 必 须 存 放 在 共享 内 存 区 中 ， 因 而 只 要 该 
共享 内 存 区 仍然 存在 ， 该 信号 量 也 就 继续 存在 。 从 图 1-3 可 以 看 出 ， 
Posix 共 享 内 存 区 和 System V 共 享 内 存 区 都 具有 随 内 核 的 持续 性 。 这 意味 
着 服务 器 可 以 创建 一 个 共享 内 存 区 ， 在 该 共享 内 存 区 中 初始 化 一 个 
Posix 基 于 内 存 的 信号 量 ， 然 后 终止 。 一 段 时 间 后 ， 一 个 或 多 个 客户 可 
打开 该 共享 内 存 区 ， 访 问 存 放 在 其 中 的 基于 内 存 的 信号 量 

ity, 下面 的 代码 并 不 像 预 期 的 那样 工作 。 


sem t mysem; 
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Sem init(&mysem, 1,0); /* 2nd arg of 1 -> shared between 
processes */ 
if (ForkQ== 0){ /* child */ 


Sem_post(&mysem); 
} 


Sem_wait(&mysem); /* parent; wait for child */ 


HAETI mysemA ERFA EKA, TEBE TRS 1.10.1275. 
fork 出 来 的 子 进程 通常 不 共享 父 进程 的 内 存 空 间 。 子 进程 是 在 父 进 程 内 
存 空间 的 副本 上 启动 的 ， 它 跟 共享 内 存 区 不 是 一 回 事 。 我 们 将 在 本 书 第 
四 部 分 详细 讨论 共享 内 存 区 。 

例子 

作为 一 个 例子 ， 我 们 把 图 10-17 和 图 10-18 中 的 生产 者 -消费 者 例子 程 
序 转 换 成 使 用 基于 内 存 的 信号 量 。 图 10-20 给 出 了 这 个 程序 。 
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#include "unpipc.h" 
#define NBUFF 10 


int nitems; /* read-only by producer and consumer */ 
struct ( /* data shared by producer and consumer */ 
int buff [NBUFF] ; 
sem t mutex, nempty, nstored; /* semaphores, not pointers */ 
) shared; 


void *produce(void *), *consume (void *); 
int 
main(int argc, char **argv) 


{ 


pthread t tid produce, tid consume; 


if (arge lS 2) 
err quit("usage: prodcons2 <#items>") ; 
nitems = atoi (argv[1]); 


/* initialize three semaphores */ 
Sem init(&shared.mutex, 0, 1); 
Sem init(&shared.nempty, 0, NBUFF); 
Sem init(&shared.nstored, 0, 0); 


Set concurrency (2); 
Pthread create(&tid produce, NULL, produce, NULL); 
Pthread create(&tid consume, NULL, consume, NULL); 


Pthread join(tid produce, NULL); 
Pthread join(tid consume, NULL); 








图 10-20 使 用 基于 内 存 信号 量 的 生产 者 一 消费 者 程序 











25 Sem_destroy (&shared.mutex) ; 


26 Sem_destroy (&shared.nempty) ; 

27 Sem_destroy (&shared.nstored) ; 

28 exit (0) ; 

29 } 

30 void * 

31 produce (void *arg) 

32 4 

33 int i; 

34 for (i = 0; i < nitems; i++) { 

35 Sem_wait (&shared.nempty) ; /* wait for at least 1 empty slot */ 
36 Sem_wait (&shared.mutex) ; 

37 shared.buff[i % NBUFF] = i; /* store i into circular buffer */ 
38 Sem_post (&shared.mutex) ; 

39 Sem_post (&shared.nstored) ; /* 1 more stored item */ 
40 } 

41 return (NULL) ; 

42 } 

43 void * 

44 consume (void *arg) 

45 { 

46 int i; 

47 for (i = 0; i < nitems; i++) { 

48 Sem_wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
49 Sem wait (&shared.mutex) ; 

50 if (shared.buff[i $ NBUFF] != i) 

51 printf ("buff [%d] = d\n", i, shared.buff[i % NBUFF]) ; 
52 Sem_post (&shared.mutex) ; 

53 Sem_post (&shared.nempty) ; /* 1 more empty slot */ 

54 } 

55 return (NULL) ; 

56 ) 
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图 10-20〈 续 ) 

分 配 信号 量 

6 本 程序 所用 的 三 个 信号 量 现在 声明 为 三 个 sem_t 数 据 类 型 的 变量 ， 
而 不 是 以 前 的 三 个 sem_t 数 据 类 型 指针 。 

调用 sem_init 

16—27 把 原来 的 sem_open 调 用 改 为 sem_init，sem_unlink 调 用 改 为 
sem_destroy。 这 几 个 sem_destroy 调 用 实际 上 没有 必要 ， 因 为 程序 号 上 就 
结束 了 。 

其 余 变 动 是 在 所 有 的 sem_wait 和 sem_post 调 用 中 传递 指向 三 个 信号 











量变 量 的 指针 。 
10.9 多 个 生产 者 ， 单 个 消费 
10.6 节 中 的 生产 者 -消费 者 方案 解雇 的 是 经 典 的 单个 生产 者 单个 消费 
者 问题 。 对 它 作 修改 后 允许 有 多 个 生产 者 和 单个 消费 者 。 我 们 从 图 10- 
20 使 用 基于 内 存 信号 量 的 方案 着 手 。 网 10-21 给 出 了 全 局 变量 和 main 函 
数 。 
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1 #include "unpipc.h" 

2 #define NBUFF 10 

3 #define MAXNTHREADS 100 

4 int nitems, nproducers; /* read-only by producer and consumer */ 

5 struct { /* data shared by producers and consumer */ 
6 int buff [NBUFF] ; 

y int nput; 

8 int nputval; 

9 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 

10 ) shared; 


11 void *produce (void *), *consume(void *); 


12 int 

13 main(int argc, char **argv) 

14 { 

15 int i, count [MAXNTHREADS] ; 

16 pthread t tid produce [MAXNTHREADS], tid consume; 
17 if (arge != 3) 

18 err quit("usage: prodcons3 <#items> <#producers>") ; 
19 nitems = atoi(argv[1]); 

20 nproducers = min(atoi(argv[2]), MAXNTHREADS) ; 

21 /* initialize three semaphores */ 

22 Sem_init (&shared.mutex, 0, 1); 

23 Sem init(&shared.nempty, 0, NBUFF) ; 

24 Sem_init (&shared.nstored, 0, 0); 

25 /* create all producers and one consumer */ 
26 Set concurrency (nproducers + 1); 

27 for (i = 0; i « nproducers; i++) { 

28 count [i] = 0; 

29 Pthread create(&tid produce[i], NULL, produce, &count [i]); 
30 } 

31 Pthread create(&tid consume, NULL, consume, NULL); 
32 /* wait for all producers and the consumer */ 
33 for (i = 0; i « nproducers; i++) { 

34 Pthread join(tid produce[i]l, NULL); 

35 printf("count[$d] = ¢d\n", i, count[il); 

36 ) 

37 Pthread join(tid consume, NULL); 

38 Sem destroy (&shared.mutex) ; 

39 Sem destroy (&shared.nempty) ; 

40 Sem destroy (&shared.nstored) ; 

41 exit (0); 

42 ) 
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110-21 创建 多 个 生产 者 线程 的 main 函 数 
全 局 变量 
4 全 局 变量 nitems 是 所 有 生产 者 生产 的 总 条 目 数 ，nproducers 是 生产 


者 线程 的 总 数 。 

它们 都 是 根据 命令 行 参数 设置 的 。 

共享 的 结构 

5—10 在 shared 结 构 中 定义 了 两 个 新 变量 : nput 和 nputval。nput 是 下 
一 个 竺 存 入 值 的 缓冲 区 项 的 下 标 〈 按 NBUFF 求 模 ) ，nputval 则 是 下 一 
个 待 存 入 缓冲 区 的 值 。 这 两 个 变量 来 自 图 7-2 和 图 7-3 中 的 解决 方案 。 它 
们 用 于 同步 多 个 生产 者 线程 。 

新 的 命令 行 参数 

17~20 ”两 个 新 的 命令 行 参数 分 别 指定 待 存 人 绥 冲 区 的 总 条 目 数 以 
及 待 创建 生产 者 线程 的 总 数 。 

创建 所 有 线程 

21~41 a di i DIT HIN 
者 线程 。 然 后 等 待 所 有 线程 终止 。 这 段 代 码 与 图 7-2 几 乎 相同 。 

图 10-22 给 出 了 由 每 个 生产 者 线程 执行 的 produce 函 数 。 
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43 void * 

44 produce (void *arg) 

45 { 

46 for ( ; ) ( 

47 ha tcI /* wait for at least 1 empty slot */ 
48 Sem wait (&shared.mutex) ; 

49 if (shared.nput »- nitems) { 

50 Sem post (&shared.nempty) ; 

51 Sem post (&shared.mutex) ; 

52 return (NULL); /* all done */ 

53 } 

54 shared. buff [shared.nput % NBUFF] = shared.nputval; 

55 shared. nput++; 

56 shared.nputval++; 

57 Sem post (&shared. mutex) ; 

58 Sem_post (&shared.nstored) ; /* 1 more stored item */ 
59 *((int *) arg) += 1; 

60 } 

61 } 
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图 10-22 所 有 生产 者 线程 都 执行 的 函数 
生产 者 线程 间 的 互 斥 











49—53 与 图 10-18 相 比 的 改变 是 ， 当 所 有 线程 总 共 往 缓冲 区 中 放置 
了 nitems 个 值 后， 循环 即 终 止 。 注 意 ， 能 同时 获取 nempty 信 号 量 的 生产 
者 线程 可 能 有 多 个 ， 但 每 个 时 刻 只 有 一 个 生产 者 线程 能 获取 mnutex 信 和 号 
量 。 这 么 一 来 ， 变 量 nput 和 nputval 就 不 会 同时 受 不 止 一 个 生产 者 线程 的 
修改 。 

生产 者 线程 的 终止 

50—51 “我们 必须 仔细 处 理 生 产 者 线程 的 终止 。 最 后 一 个 条 目 生 产 
出 来 后 ， 每 个 生产 者 线程 都 执行 循环 顶端 的 如 下 一 行 语 句 : 

Sem_wait(&shared.nempty); /* wait for at least 1 empty slot */ 

它 将 nempty 信 号 量 减 1。 然 而 每 个 生产 者 线程 在 终止 前 必须 给 该 信 
号 量 加 1， 因 为 它 在 最 后 一 次 走 过 循 环 时 并 没有 往 缓冲 区 中 存 入 一 个 条 
目 。 即 将 终止 的 生产 者 线程 还 得 释放 mutex 信 号 量 ， 以 允许 其 他 生产 者 
线程 继续 运行 。 要 是 线程 终止 时 我 们 没有 给 nempty 信 号 量 加 1， 而 且 生 
产 者 线程 数 大 于 绥 冲 区 槽 位 数 〈( 壁 如 说 14 个 生产 者 线程 和 10 个 缓冲 区 本 
位 )， 那 么 多 余 的 线程 (4 个 ) 将 永远 阻塞 ， 等 竺 nempty 信 号 量 ， 从 而 
永远 终止 不 了 。 [5] 

图 10-23 中 的 consume 函 数 只 是 验证 缓冲 区 中 每 个 项 都 是 正确 的 ， 如 
末 检 测 到 错误 就 输出 一 个 消 妃 。 
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62 void * 

63 consume (void *arg) 

64 { 

65 int 1; 

66 for (i = 0; i < nitems; i++) { 

67 Sem_wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
68 Sem_wait (&shared.mutex) ; 

69 if (shared.buff[i % NBUFF] != i) 

70 printf ("error: buff [bd] = %d\n", i, shared.buff[i % NBUFF]); 
71 Sem_post (&shared.mutex) ; 

72 Sem post (&shared.nempty) ; /* 1 more empty slot */ 

73 } 

74 return (NULL) ; 

75 } 
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图 10-23 唯一 的 消费 者 线程 执行 的 函数 
这 个 唯一 的 消费 者 线程 的 终止 条 件 非 常 简单 一 一 它 只 需 统 计 已 消费 
的 条 目 数 。 








10.10 多 个 生产 者 ， 多 个 消费 者 


对 于 生产 者 -消费 者 问题 的 进一步 修改 是 允许 多 个 生产 者 和 多 个 消 
费 者 。 具 有 多 个 消费 者 是 否 有 意义 取决 于 具体 应 用 。 作 者 看 到 过 使 用 这 
种 技巧 的 两 个 应 用 程序 。 

(1) 一 个 把 IP 地 址 转换 成 对 应 主机 名 的 程序 。 每 个 消费 者 取 一 个 IP 地 
址 ， 调 用 gethostbyaddr (CUNPvl 的 9.6 节 ) ， 然 后 往 某 个 文件 中 添加 得 出 
的 主机 名 。 由 于 每 次 调用 gethostbyaddr 所 花 时 间 可 能 不 一 样 ， 因 此 缓冲 
区 中 IP 地 址 的 顺序 通常 与 各 个 消费 者 线程 存 入 结果 的 文件 中 的 主机 名 顺 
序 不 一 致 。 这 种 情形 的 优势 在 于 多 个 gethostbyaddr 调 用 〈 每 个 调用 可 能 
得 花 数 秒 ) 可 以 并 行 地 发 生 : 每 个 消费 者 线程 一 个 调用 。 

这 里 假设 gethostbyaddr 是 一 个 可 重 入 版 本 的 函数 ， 然 而 不 是 所 有 实 
现 都 具备 这 个 属性 。 要 是 可 重 入 版 本 的 gethostbyaddr 函 数 不 可 用 ， 候 选 
方法 之 一 就 是 将 缓冲 区 存放 在 共享 内 存 区 中 ， 并 改 用 多 个 进程 代 蔡 多 个 
线程 。 

(2) 一 个 读 出 UDP 数 据 报 ， 对 它们 进行 操作 后 把 结果 写 入 某 个 数据 库 
的 程序 。 每 个 数据 报 由 一 个 消费 者 线程 处 理 ， 为 重 登 可 能 很 花 时 间 的 每 
个 数据 报 的 处 理 ， 需 要 有 多 个 消费 者 线程 。 尽 管 由 消费 者 线程 们 写 入 数 
据 库 中 的 数据 报 顺序 通常 不 同 于 原来 的 数据 报 顺 序 ， 数 据 库 中 的 记录 排 
序 功 能 却 能 处 理 顺序 问题 。 

图 10-24 给 出 了 全 局 变量 。 
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1 #include "unpipc.h" 

2 #define NBUFF 10 

3 #define MAXNTHREADS 100 

4 int nitems, nproducers, nconsumers; /* read-only */ 

5 struct ( /* data shared by producers and consumers */ 
6 int buff [NBUFF] ; 

7 int nput; /* item number: 0, 1, 2, ... */ 

8 int nputval; /* value to store in buff[] */ 

9 int nget; /* item number: 0, 1, 2, ... */ 
10 int ngetval; /* value fetched from buff[] */ 
11 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 
12 ) shared; 

13 void *produce(void *), *consume(void *); 

pxsem/prodcons4.c 
图 10-24 全 局 变量 








全 局 变量 和 共享 的 结构 

4—12 消费 者 线程 数 现在 是 一 个 全 局 变量 ， 它 是 根据 一 个 命令 行 参 
数 设 置 的 。 我 们 还 往 shared 结 构 中 加 了 另外 两 个 变量 : nget 和 ngetval。 
nget 是 任意 一 个 消费 者 线程 竺 取出 的 下 一 个 条 目的 编号 ，ngetval 则 存放 
相应 的 值 。 

图 10-25 给 出 的 main 函 数 已 修改 成 创建 多 个 消费 者 线程 。 
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14 int 
15 main(int argc, char **argv) 
16 { 
17 int i, prodcount [MAXNTHREADS], conscount [MAXNTHREADS] ; 
18 pthread t tid produce[MAXNTHREADS], tid consume [MAXNTHREADS] ; 
19 if (argc !- 4) 
20 err quit("usage: prodcons4 <#items> <#producers> <#consumers>") ; 
21 nitems = atoi(argv[1]); 
22 nproducers = min(atoi(argv[2]), MAXNTHREADS) ; 
23 nconsumers = min(atoi(argv[3]), MAXNTHREADS) ; 
24 /* initialize three semaphores */ 
25 Sem_init (&shared.mutex, 0, 1); 
26 Sem init(&shared.nempty, 0, NBUFF) ; 
27 Sem init(&shared.nstored, 0, 0); 
28 /* create all producers and all consumers */ 
29 Set concurrency (nproducers + nconsumers); 
30 for (i = 0; i < nproducers; i++) { 
31 prodcount [i] = 0; 
32 Pthread_create (&tid_produce [i], NULL, produce, &prodcount [i] ) ; 
33 } 
34 for (i = 0; i < nconsumers; i++) { 
35 conscount [i] = 0; 
36 Pthread_create(&tid_consume[i], NULL, consume, &conscount [i] ) ; 
37 } 
38 /* wait for all producers and all consumers */ 
39 for (i = 0; i < nproducers; i++) { 
40 Pthread join(tid produce[i], NULL); 
41 printf ("producer count[$d] = %d\n", i, prodcount[i]); 
42 
43 for (i = 0; i « nconsumers; i++) { 
图 10-25 创建 多 个 生产 者 和 多 个 消费 者 的 main 函 数 
44 Pthread_join(tid_consume [i], NULL) ; 
45 printf ("consumer count [$d] = %d\n", i, conscount [i] ) ; 
46 
47 Sem destroy (&shared.mutex) ; 
48 Sem destroy (&shared.nempty) ; 
49 Sem_destroy (&shared.nstored) ; 
50 exit (0) ; 
51 } 





图 10-25〈 续 ) 


19—23 ”增设 一 个 新 的 命令 行 选项 ， 
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由 它 指定 竺 创建 消费 者 线程 的 


总 数 。 我 们 必须 分 配 一 个 数组 (tid consume) 以 保存 所 有 消费 者 的 线程 


再 分 配 一 个 数组 〈conscount) 以 保存 每 个 消费 者 线程 处 理 的 条 目 


数 ， 作 为 诊断 计数 。 
24—50 ”创建 多 个 生产 者 线程 和 多 个 消费 者 线程 ， 
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我 们 的 生产 者 函数 含有 图 10-22 中 没有 的 一 个 新 行 。 当 所 有 的 生产 
者 线程 完成 生产 工作 时 ， 前 面 标 以 加 号 的 那 一 行 是 新 加 的 : 


if (shared.nput >= nitems){ 








+ Sem_post(&shared.nstored); /* let consumers terminate */ 
Sem, post(&shared.nempty); 
Sem post(&shared.mutex); 
return( NULL); /* all done */ 
j 
在 处 理 生产 者 线程 和 消费 者 线程 的 终止 时 ， 我 们 仍 得 小 心 。 绥 冲 区 
中 所 有 条 目 都 被 消费 挤 之 后 ， 每 个 消费 者 线程 将 阻 旱 在 如 下 调用 中 : 


Sem_wait(&shared.nstored); /* wait for at least 1 stored item 





- 

我 们 让 每 个 生产 者 线程 给 nstored 信 号 量 加 1 以 给 各 个 消费 者 线程 解 
阻塞 ， 以 此 让 消费 者 们 看 到 生产 者 们 已 完成 生产 工作 。 

图 10-26 给 出 了 我 们 的 消费 者 函数 。 











pxsem/prodcons4.c 





72 void * 


73 consume (void *arg) 

74 { 

75 int i; 

76 for (C xí 

737 Sem wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
78 Sem wait (&shared.mutex) ; 

79 if (shared.nget »- nitems) { 

80 Sem post (&shared.nstored) ; 

81 Sem post (&shared.mutex) ; 

82 return (NULL); /* all done */ 

83 } 

84 i = shared.nget % NBUFF; 

85 if (shared.buff[i] != shared.ngetval) 

86 printf ("error: buff[%d] = ¢d\n", i, shared.buff[il); 
87 shared .nget++; 

88 shared.ngetval++; 

89 Sem_post (&shared.mutex) ; 

90 Sem_post (&shared.nempty) ; /* 1 more empty slot */ 
91 *((int *) arg) += 1; 

92 } 

93 } 


pxsem/prodcons4.c 





8110-26 所 有 消费 者 线程 都 执行 的 函数 
消费 者 线程 的 终止 
79—83 新 的 消费 者 函数 必须 比较 nget 和 nitems， 以 确定 所 有 消费 者 
线程 完成 消费 工作 的 时 刻 《〈 类 似 于 生产 者 函数 ) 。 绥 冲 区 中 最 后 一 个 条 
目 被 消费 摊 之 后 ， 各 个 消费 者 线程 阻塞 ， 等 待 nstored 信 号 量变 为 大 于 
0。 这 么 一 来 ， 每 个 生产 者 线程 终止 时 ， 应 给 nstored 加 1 以 让 一 个 消费 者 
线程 终止 。 [6] 























10.11 多 个 缓冲 区 


在 处 理 一 些 数据 的 典型 程序 中 ， 我 们 可 以 找到 一 个 如 下 形式 的 循 
环 : 
while ( (n = read(fdin,buff, BUFFSIZE))> 0){ 
/* process the data */ 


write(fdout,buff,n); 


举例 来 说 ， 处 理 文 本 文件 的 许多 程序 读 入 一 行 输入 ， 对 它 进行 处 

， 然 后 写 出 一 行 输出 。 对 于 文本 文件 ，read 和 write 调用 往往 被 蔡 换 成 
à fi HETO RK Zitfgets Fil fputs Ay val H « 

图 10-27 展 示 了 实现 这 种 操作 的 一 种 方法 ， 其 中 名 为 reader 的 函数 从 
输入 文件 读 入 数据 ， 名 为 writer 的 函数 往 输出 文件 写 出 数据 。 总 共 使 用 
一 个 缓冲 区 。 


reader () 缓冲 区 writer () 











110-27 由 一 个 进程 把 数据 读 入 某 个 缓冲 区 ， 再 从 该 缓冲 区 写 出 

图 10-28 给 出 了 整个 操作 的 时 间 线 图 。 我 们 在 时 间 线 的 左边 按 从 上 
到 下 的 时 间 增 长 顺序 标 出 了 数值 ， 时 间 单 位 则 是 某 个 任意 值 。 我 们 假设 
一 个 读 操 作 花 5 个 单位 时 间 ， 一 个 写 操作 人 花 7 个 单位 时 间 ， 读 和 号 之 间 的 
处 理 花 2 个 单位 时 间 。 

我 们 可 以 把 这 个 应 用 修改 成 在 两 个 线程 间 分 割 读 写 操作 ， 如 图 10- 
29 所 示 。 这 儿 我 们 使 用 两 个 线程 ， 因 为 各 个 线程 自动 共 圣 同一 个 全 局 绥 
冲 区 。 我 们 也 可 以 把 复制 操作 分 割 到 两 个 进程 中 ， 不 过 那 将 需要 使 用 还 
没有 讨论 的 共 孚 内 存 区 
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图 10-28 由 一 个 进程 把 数据 读 入 某 个 缓冲 区 ， 再 从 该 缓冲 区 写 出 
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图 10-29 把 文件 复制 操作 分 割 到 两 个 线程 中 
把 读 写 操作 分 割 到 两 个 线程 (或 两 个 进程 》 中 还 需要 线程 (或 进 
FE) 间 茶 种 形式 的 通知 。 当 缓冲 区 准备 好 写 出 时 ， 读 入 者 线程 必须 通知 





写 出 者 线程 ;同样 ， 当 缓冲 区 准备 好 重新 读 入 时 ， 写 出 者 线程 必须 通知 
读 入 者 线程 。 图 10-30 给 出 了 这 种 操作 的 时 间 线 图 。 


读 入 者 线程 写 出 者 线程 
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图 10-30 把 文件 复制 操作 分 割 到 两 个 线程 中 
我 们 假设 处 理 缓 冲 区 中 数据 以 及 通知 对 方 线程 花 两 个 单位 时 间 。 需 
特别 注意 的 是 ， 把 读 和 写 分 割 到 两 个 线程 中 并 不 影响 完成 整个 操作 所 需 
时 间 。 我 们 没有 得 到 任何 速度 上 的 优势 ， 只 是 把 整个 操作 分 割 到 两 个 线 
程 ( 或 进程 ) 中 。 
我 们 在 这 些 时 间 线 图 中 忽略 了 许多 细微 点 。 例 如 ， 大 多 数 Unix 内 核 


检测 出 对 一 个 文件 的 顺序 读 后 就 为 读 进程 执行 对 下 一 个 磁盘 块 的 异步 超 
HUGE (read ahead) 。 这 可 以 改善 执行 这 种 类 型 操作 所 花 的 称 为 “时 钟 时 
间 (clock time) ”的 实际 时 间 量 。 我 们 还 忽略 了 其 他 进程 对 于 我 们 的 读 
入 者 线程 和 写 出 者 线程 的 影响 以 及 内 核 调 度 算法 的 效果 。 

接 下 去 我 们 可 以 把 文件 复制 应 用 修改 成 使 用 两 个 线程 (或 进程 》 和 
两 个 缓冲 区 。 这 就 是 经 典 的 双 缓 冲 〈double buffering) 方案 ， 如 图 10-31 
所 示 。 

图 中 夯 出 读 入 者 线程 正在 往 第 一 个 缓冲 区 中 读 入 数据 ， 写 出 者 线程 
正在 从 第 二 个 缓冲 区 中 写 出 数据 。 这 两 个 缓冲 区 随后 就 在 这 两 个 线程 间 
来 回 切换 。 

图 10-32 展 示 了 双 组 冲 方案 的 时 间 线 图 。 读 入 者 首先 读 入 缓冲 区 1， 
然后 通知 写 出 者 缓冲 区 1 准备 好 处 理 。 读 入 者 随后 开始 读 入 缓冲 区 2， 其 
间 写 出 者 在 从 缓冲 区 1 中 写 出 数据 。 














图 10-31 使 用 两 个 缓冲 区 把 文件 复制 操作 分 割 到 两 个 线程 中 


读 入 者 线程 写 出 者 线程 
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图 10-32 双 绥 冲 方案 的 时 间 线 图 
注意 ， 我 们 不 能 走 得 快 于 最 慢 的 操作 ， 在 本 例子 中 就 是 写 操作 。 服 
务 器 完成 前 两 个 读 操作 后 ， 不 得 不 额外 等 待 2 个 单位 时 间 : 写 操作 所 龙 
la] (7) 与 读 操作 所 花 时 间 (5) 之 兰 。 然 而 对 于 我 们 这 个 假想 的 例子 
来 说 ， 双 缓冲 方案 所 花 的 总 时 钟 时 间 几 乎 只 有 单 缓冲 方案 的 一 半 。 











还 要 注意 ， 写 出 操作 现在 是 在 尽 可 能 快 地 发 生 着 ， 每 两 个 写 操作 间 
仅 有 2 个 单位 时 间作 为 分 隔 ， 而 图 10-28 和 图 10-30 中 却 有 9 个 单位 时 间作 
为 分 隅 。 这 种 状况 有 助 于 某 些 像 磁带 驱动 器 这 样 的 设备 ， 这 些 设备 在 尽 
可 能 快 地 往 它 们 写 入 数据 的 条 件 下 会 动作 得 更 快 〈 这 称 为 鱼贯 

(streaming) 模式 ) 。 

有 关 双 缓冲 问题 需 注 意 的 有 趣 之 事 是 ， 它 仅仅 是 生产 者 一 消费 者 问 
题 的 一 个 特例 。 

现在 开始 把 以 前 的 生产 者 -消费 者 程序 修改 为 处 理 多 个 缓冲 区 。 我 
们 从 图 10-20 中 使 用 基于 内 存 信 号 量 的 方案 入 手 。 新 方案 能 处 理 任意 数 
量 的 缓冲 区 (由 NBUFF 定 义 )， 而 不 只 是 个 双 绥 冲 方案 。 图 10-33 给 出 
了 全 局 变量 和 main 据 数 。 




















pxsem/mycat2.c 
1 #include "unpipc.h" 


2 #define NBUFF 8 


3 struct ( /* data shared by producer and consumer */ 
4 struct { 

5 char data [BUFFSIZE]; /* a buffer */ 

6 ssize t n; /* count of #bytes in the buffer */ 

7 ) buff [NBUFF] ; /* NBUFF of these buffers/counts */ 

8 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 
9 ) shared; 

10 int fd; /* input file to copy to stdout */ 

11 void *produce (void *), *consume(void *); 

12 int 

13 main(int argc, char **argv) 

14 ( 

15 pthread t tid produce, tid consume; 

16 if (arge != 2) 

T7 err quit("usage: mycat2 <pathname>") ; 

18 fd = Open(argv[1], O RDONLY); 

19 /* initialize three semaphores */ 

20 Sem init(&shared.mutex, 0, 1); 

21 Sem init(&shared.nempty, 0, NBUFF); 

22 Sem init(&shared.nstored, 0, 0); 

23 /* one producer thread, one consumer thread */ 

24 Set concurrency (2); 

25 Pthread create(&tid produce, NULL, produce, NULL); /* reader thread */ 
26 Pthread create(&tid consume, NULL, consume, NULL); /* writer thread */ 
27 Pthread join(tid produce, NULL) ; 

28 Pthread join(tid consume, NULL); 

29 Sem destroy (&shared.mutex) ; 

30 Sem destroy (&shared.nempty) ; 

31 Sem destroy (&shared.nstored) ; 

32 exit (0); 

33 ) 





pxsem/mycat2.c 
图 10-33 全 局 变量 和 main 函 数 
声明 NBUFF 个 绥 冲 区 
2 一 9 新 的 shared 结 构 含 有 另 一 个 名 为 buff 的 结构 的 数组 ， 而 这 个 新 
结构 含有 一 个 缓冲 区 和 和 它 的 当前 字 节 计数 。 
打开 输入 文件 
18 命令 行 参数 是 我 们 将 把 其 内 容 复制 到 标准 输出 的 文件 的 路 径 





名 。 
图 10-34 给 出 了 produce 和 consume 函 数 。 


pxsem/mycat2.c 





34 void * 

35 produce (void *arg) 

3e ( 

37 int i; 

38 for (i = 0; ; ) { 

39 Sem_wait (&shared.nempty) ; /* wait for at least 1 empty slot */ 
40 Sem_wait (&shared.mutex) ; 

41 /* critical region */ 

42 Sem_post (&shared.mutex) ; 

43 shared.buff[i].n = Read(fd, shared.buff[i].data, BUFFSIZE) ; 
44 if (shared.buff[i].n == 0) { 

45 Sem post(&shared.nstored); /* 1 more stored item */ 
46 return (NULL) ; 

47 } 

48 if (++i >= NBUFF) 

49 i = 0; /* circular buffer */ 

50 Sem_post (&shared.nstored) ; /* 1 more stored item */ 
51 } 

52 } 

53 void * 

54 consume (void *arg) 

55 ( 

56 int i; 

57 for (i = pre) d 

58 Sem wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
59 Sem_wait (&shared.mutex) ; 

60 /* critical region */ 

61 Sem_ post (&shared.mutex) ; 

62 if (shared.buff[i].n == 0) 

63 return (NULL) ; 

64 Write (STDOUT_FILENO, shared.buff[i].data, shared.buff[i].n); 
65 if (++i >= NBUFF) 

66 i = 0; /* circular buffer */ 

67 Sem_post (&shared.nempty) ; /* 1 more empty slot */ 

68 } 

69 } 


pxsem/mycat2.c 





图 10-34 produce #llconsume P% Zi 


空 临界 区 

40 一 42 本 例子 中 由 mutex 锁 住 的 临界 区 是 空 的 。 要 是 数据 缓冲 区 是 
在 一 个 链表 上 维护 的 ， 那 么 这 儿 就 是 我 们 从 该 链表 中 移出 茶 个 缓冲 区 的 
地 方 ， 把 该 操作 放 在 临界 区 中 是 为 了 避免 与 消费 者 对 该 链表 的 操纵 发 生 
冲突 。 然 而 在 我 们 的 例子 中 ， 生 产 者 只 是 使 用 下 一 个 缓冲 区 ， 而 且 生 产 


者 线程 只 有 一 个 ， 因 此 没有 什么 东西 需 保护 以 避免 消费 者 干扰 。 我 们 仍 
然 给 出 了 mnutex 的 上 锁 和 解锁 ， 目 的 是 强调 本 代码 的 其 他 修改 版 本 中 也 
许 需要 这 些 。 

读 入 数据 并 给 nstored 信 号 量 加 1 

43 一 49 生产 者 每 获得 一 个 空闲 缓冲 区 就 调用 read。read 返 回 后 生产 
者 将 nstored 信 号 量 加 1， 告 诉 消费 者 该 缓冲 区 准备 好 写 出 。 如 果 read 返 回 
0《〈 文 件 结束 符 ) ， 生 产 者 就 在 给 nstored 信 号 量 加 1 后 返回 。 

消费 者 线程 

57~68 ”消费 者 线程 取出 缓冲 区 中 数据 并 把 它们 的 内 容 写 到 标准 输 
出 。 位 到 长 上 度 为 0 的 一 个 缓冲 区 表示 已 到 达 文 件 尾 。 跟 生产 者 函数 一 
样 ， 由 mutex 保 护 着 的 临界 区 也 是 空 的。 

我 们 在 UNPV1 的 22.3 节 中 开发 了 一 个 使 用 多 个 缓冲 区 的 例子 。 在 那 
个 例子 中 ， 生 产 者 是 SIGIO 信 号 处 理 程序 ， 消 费 者 是 主 处 理 循环 

(do_echorki2) 。 在 生产 者 和 消费 者 之 间 共 享 的 变量 是 nqueue 计 数 

人 如。 消 颖 者 每 次 检查 或 修改 该 计数 费时 部 阻 墅 SIGIO 信 号 以 防止 它 产 
生 。 














10.12 进程 间 共 享 信号 量 








进程 间 共 享 基于 内 存 信 号 量 的 规则 很 简单 : 信号 量 本 映 〈 其 地 址 作 
为 sm_init 第 一 个 参数 的 sem_t 数 据 类 型 变量 ) 必须 驻 留 在 由 所 有 和 希望 共 
享 它 的 进程 所 共享 的 内 存 区 中 ， 而 且 sem_init 的 第 二 个 参数 必须 为 1。 

这 些 规 则 与 进程 间 共 享 互 斥 锁 、 条 件 变量 或 读 写 锁 的 规则 类 似 : Fu] 
步 对 象 本 身 (pthread_mnutex_t 变 量 、pthread_cond_t 变 量 或 
pthread_rwlock_t 变 量 ) 必须 驻 留 在 由 所 有 希望 共享 它 的 进程 所 共享 的 内 
存 区 中 ， 而 且 该 对 象 必须 以 PTHREAD_PROCESS_SHARED 属 性 初始 
is 








至 于 有 名 信号 量 ， 不 同 进程 (不 论 彼 此 间 有 无 杀 缘 关系 ) 总 是 能 够 
访问 同一 个 有 名 信号 量 ， 只 要 它们 在 调用 sem_open 时 指定 相同 的 名 字 束 
行 。 即 使 对 于 某 个 给 定名 字 的 sem_open 调 用 在 每 个 调用 进程 中 可 能 返回 
不 同 的 指针 ， 使 用 该 指针 的 信号 量 函 数 〈 例 如 sem_post 和 sem_wait) 所 
引用 的 仍然 是 同一 个 有 名 信和 号 量 。 

如 果 我 们 在 调用 sem_open 返 回 指 癌 某 个 sem_t 数 据 类 型 变量 的 指针 
后 接着 调用 fork， 和 情况 叉 会 怎么 样 呢 ? Posix. 10] 2«forkef Z4 T] HAS 30x 
么 说 :“ 在 父 进 程 中 打开 的 任何 信号 量 仍 应 在 子 进程 中 打开 。” 这 意味 着 
如 下 形式 的 代码 是 正确 的 : 

sem_t *mutex; /* global pointer that is copied across the 
fork()*/ 





/* parent creates named semaphore */ 
mutex = Sem_open(Px_ipc_name(NAME),O_CREAT 
O_EXCL,FILE_MODE,0); 
if ( (childpid = Fork())== 0){ 
/* child */ 


Sem_wait(mutex); 


} 


/* parent */ 


Sem_post(mutex); 


我 们 必须 仔细 捅 清 什么 时 候 可 以 或 者 不 可 以 在 不 同 进程 间 共 享 共 个 
信号 量 的 原因 : 一 个 信号 量 的 状态 可 能 包含 在 它 本 里 的 sem_t 数 据 类 型 











中 ， 但 它 还 可 能 使 用 其 他 信息 《例如 文件 描述 符 ) 。 我 们 将 在 下 一 章 看 
到 ， 一 个 进程 用 于 描述 一 个 System V 信 和 号 量 的 唯一 句柄 是 由 semget 返 回 
的 它 的 整数 标识 符 。 知 道 这 个 标识 符 的 任何 进程 都 可 以 访问 该 信号 量 。 
System V 信 号 量 的 所 有 状态 都 包含 在 内 核 中 ， 它 们 的 整数 标识 符 只 是 告 
诉 内 核 具 体 引 用 哪个 信号 量 。 





10.13 信号 量 限 基 


Posix 定 义 了 两 个 信号 量 限制 : 
SEM_NSEMS_MAX 一 个 进程 可 同时 打开 着 的 最 大 信号 量 数 〈Posix 








要 求 至 少 为 256) ; 
SEM. VALUE MAX 一 个 信号 量 的 最 大 值 (Posix 要 求 至 少 为 
32767) 。 


这 两 个 常 值 通 常 定 义 在 <unistd.h> 头 文件 中 ， 也 可 在 运行 时 通过 调 
用 sysconf 函 数 获 取 ， 如 下 面 的 例子 所 示 。 

例子 : semsysconf 程 序 

图 10-35 中 的 程序 调用 sysconf 输 出 信号 量 的 两 个 由 实现 定义 的 限制 
值 。 





pxsem/semsysconf.c 
1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 
4 ( 
printf("SEM NSEMS MAX = $1d, SEM VALUE MAX = %ld\n", 
Sysconf( SC SEM NSEMS MAX), Sysconf( SC SEM VALUE MAX)); 


5 
6 
7 exit(0); 
8 





pxsem/semsysconf.c 





图 10-35 调用 sysconf 获 取信 和 号 量 限 制 值 


在 我 们 的 两 个 系统 上 执行 该 程序 的 结果 如 下 : 
solaris % semsysconf 
SEM_NSEMS_MAX = 2147483647,SEM_VALUE_MAX = 


2147483647 
alpha % semsysconf 
SEM NSEMS MAX = 256,SEM_VALUE_MAX = 32767 


10.14 FIFO 实 现 信号 量 








现在 提供 一 个 使 用 FIFO 完 成 的 Posix 有 名 信号 量 的 实现 。 每 个 有 名 
信和 号 量 作为 一 个 使 用 同一 名 字 的 FIFO 来 实现 ， 该 FIFO 中 的 非 负 字 节 数 
代表 该 信号 量 的 当前 值 。sem_post 函 数 往 该 FIFO 中 写 入 1 个 字 节 ， 
sem_wait 国 数 则 从 该 FIFO 中 读 出 一 个 字 节 《我 们 希望 如 果 该 FIFO 为 空 ， 
那天 阻塞 调用 线程 ) 。sem_open 函 数 在 指定 了 O_CREAT 标 志 的 前 提 下 
创建 竺 打开 的 FIFO， 然 后 〈 不 论 是 人 否 指定 了 O_CREAT) 打开 该 FIFO 两 
次 (一 次 用 于 只 读 ， 一 次 用 于 只 写 ) ， 如 果 该 FIFO 是 新 创建 的 ， 那 就 往 
其 中 写 入 作为 信号 量 初 始 值 指定 的 那个 数目 的 字 节 。 

本 节 和 本 章 其 余 各 节 含 有 你 第 一 次 阅读 时 可 能 希望 暂时 跳 过 的 高 级 
主题 内 容 。 

我 们 首先 在 图 10-36 中 给 出 semaphore.h 头 文件 ， 它 定义 了 基本 的 


sem_t 数 据 类 型 。 








my_pxsem_fifo/semaphore.h 


1 /* the fundamental datatype */ 

2 typedef struct { 

3 int sem fd[2]; /* two fds: [0] for reading, [1] for writing */ 
4 int sem magic; /* magic number if open */ 

5 ) sem t; 


6 #define SEM MAGIC 0x89674523 


7 #ifdef SEM FAILED 

8 #undef SEM FAILED 

9 #define SEM FAILED  ((sem t *) (-1)) /* avoid compiler warnings */ 

10 #endif 

my pxsem fifo/semaphore.h 





10-36 semaphore.h 头 文件 


sem_t 数 据 类 型 
1—5 我们 的 信号 量 数 据 结构 包含 两 个 描述 符 ， 一 个 用 于 从 实现 它 








的 FIFO 中 读 ， 一 个 用 于 往 实 现 它 的 FIFO 中 写 。 为 与 管道 保持 一 致 ， 我 
们 将 这 两 个 描述 符 存 放 在 某 个 仅 有 两 个 元 素 的 数组 中 ， 第 一 个 元 系 存 放 
读 描 述 符 ， 第 二 个 元 素 存 放 写 描述 符 。 

一 旦 该 结构 初始 化 ，sem_magic 成 员 将 含有 常 值 SEM_MAGIC。 接 
受 一 个 sem_t 指 针 作为 参数 的 每 个 函数 都 检查 该 值 ， 从 而 判定 该 指针 确 
实 指 同 一 个 已 初始 化 的 信号 量 结 构 。 

当 关 闭 一 个 信号 量 时 ， 其 sem_t 数 据 结 构 中 的 这 个 成 员 将 被 置 为 0。 
这 种 技巧 尽管 不 大 完善 ， 却 有 助 于 检查 一 些 编程 错误 。 

10.14.1 sem_open 函 数 

图 10-37 给 出 了 我 们 的 sem_open 函 数 ， 它 创建 一 个 新 的 信号 量 或 打 
开 一 个 已 存在 的 信号 量 。 

创建 一 个 新 的 信号 量 

13—17 如 果 调 用 者 指定 了 O_CREAT 标 志 ， 我 们 就 知道 需要 的 是 四 
个 而 不 是 两 个 参数 。 我 们 调用 va_start 初 始 化 ap 变 量 ， 让 它 指 向 最 后 一 个 
命名 过 的 参数 (oflag) 。 然 后 使 用 ap 和 系统 实现 提供 的 va_arg 函 数 获 取 
第 三 和 第 四 个 参数 的 值 。 我 们 已 随 图 5-21 摘 述 过 可 变 参 数 表 和 我 们 的 
va_mode_t 数 据 类 型 。 

创建 新 的 FIFO 

18~23 ”创建 一 个 新 的 FIFO， 其 名 字 为 调用 者 指定 给 信号 量 的 名 
字 。 跟 4.6 节 中 讨论 过 的 一 样 ， 如 果 该 FIFO 已 经 存在 ，mkfifo 函 数 将 返回 
一 个 EEXIST 错 误 。 如 果 sem_open 的 调用 者 没有 指定 O_EXCL 标 志 ， 那 
么 这 种 错误 无 关 紧 要 ， 不 过 我 们 不 想 以 后 在 本 函数 中 再 次 初始 化 该 
FIFO, T EXBO CREATb S. 

分 配 sem_t 数 据 类 型 ， 打 开 FIFO 分 别 用 于 读 和 与 

25—37 为 一 个 sem_t 数 据 类 型 分 配 空间 ， 它 将 含有 两 个 描述 符 。 打 
开 新 创建 或 已 存在 的 FIFO 两 次 ， 一 次 用 于 只 读 ， 一 次 用 于 只 写 。 我 们 不 
想 阻 塞 在 这 两 个 open 调 用 的 任何 一 个 之 中 ， 因 此 在 打开 该 FIFO 只 读 时 指 


























定 了 O_NONBLOCK 标 志 “【 回 想 图 4-21) 。 当 打开 FIFO 只 写 时 ， 我 们 也 
中 定 O_NONBLOCK 标 志 ， 不 过 是 为 了 将 来 检测 洪 出 《例如 试图 往 该 管 
道中 写 入 多 于 PIPE_BUF 个 字 节 ) 。 打 开 该 FIFO 两 次 之 后 ， 关 掉 只 读 描 
述 符 上 的 非 阻 塞 标志 。 

初始 化 新 创建 信号 量 的 值 

38—42 ”如 果 创 建 了 一 个 新 的 信号 量 ， 我 们 就 通 过 向 实现 它 的 FIFO 
逐个 写 入 总 共 value 个 字 节 来 初始 化 它 的 值 。 如 果 这 个 初始 值 超过 了 系统 
实现 给 定 的 PIPE_BUF 限 制 ， 那 么 该 FIFO 填 满 后 再 次 调用 的 write 将 返回 
一 个 EAGAIN 错 误 。 





my_pxsem_fifo/sem_open.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 #include <stdarg.h> /* for variable arg lists */ 


4 sem t : 
5 sem open(const char *pathname, int oflag, ... ) 


6 { 

7 int i, flags, save_errno; 

8 char e; 

9 mode t mode; 

10 va list ap; 

11 sem t *sem; 

12 unsigned int value; 

13 if (oflag & O CREAT) { 

14 va start(ap, oflag); /* init ap to final named argument */ 
15 mode = va arg(ap, va mode t); 

16 value - va arg(ap, unsigned int); 

17 va end(ap); 

18 if (mkfifo(pathname, mode) < O) { 

19 if (errno -- EEXIST && (oflag & O EXCL) -- 0) 

20 oflag &= -O CREAT; /* already exists, OK */ 
21. else 

22 return(SEM FAILED); 

23 } 

24 } 

25 if ( (sem = malloc(sizeof(sem_t))) == NULL) 

26 return (SEM FAILED); 

27 sem-»sem fd[0] = sem-»sem fd[1] = -1; 

28 if ( (sem-»sem fd[0] - open(pathname, O RDONLY | O NONBLOCK)) « 0) 
29 goto error; 

30 if ( (sem-»sem fd[1] - open(pathname, O WRONLY | O NONBLOCK)) < 0) 
31 góto error; 

32 /* turn off nonblocking for sem fd[0] */ 

33 if ( (flags = fcntl(sem-»sem fd[0], F GETFL, 0)) < 0) 

34 goto error; 

35 flags &- -O NONBLOCK; 

36 if (fcntl(sem-»sem fd[0], F SETFL, flags) < 0) 

37 goto error; 

38 if (oflag & O CREAT) ( /* initialize semaphore */ 
39 for (i = 0; i < value; i++) 
40 if (write(sem->sem_fd[1], &c, 1) != 1) 
41 goto error; 
42 ) 
43 sem->sem_ magic = SEM MAGIC; 
44 return(sem); 


45 error: 


46 Save errno - errno; 

47 if (oflag & O CREAT) 

48 unlink (pathname) ; /* if we created FIFO */ 
49 close (sem->sem_fd[0]) ; /* ignore error */ 

50 close (sem-»sem fd[1]); /* ignore error */ 

51 free (sem); 

52 errno - save errno; 

53 return(SEM FAILED); 

54 } 


my_pxsem_fifo/sem_open.c 





图 10-37 sem_open 函 数 


10.14.2 sem closer Zi 
图 10-38 给 出 了 我 们 的 sem_dlose 函 数 。 


my_pxsem_fifo/sem_close.c 





1 #include "unpipc.h" 
2 #include "semaphore .hy 
3. Int 


4 sem close(sem t *sem) 

5 { 

6 if (sem-»sem magic !- SEM MAGIC) ( 
7 errno - EINVAL; 

8 return(-1); 


9 ) 


10 sem-»sem magic - 0; /* in case caller tries to use it later */ 
11 if (close(sem-»sem fd[0]) == -1 || close(sem-»sem fd[1]) == -1) { 

12 free (sem) ; 

13 return (-1) ; 

14 } 

15 free (sem) ; 

16 return (0) ; 

17 } 


my_pxsem_fifo/sem_close.c 





图 10-38 sem_close bk Zi 
11~15 close 由 调用 者 指定 的 信号 量 结构 中 的 两 个 FIFO 描 述 符 ，free 
分 配给 这 个 sem _t 数 据 类 型 的 空间 。 
10.14.3 sem_unlink px žk 
10-3926 H1 f 4l] sem unlinkeA ZA, Fa ABR SSE-ME SRR 
的 名 字 。 它 只 是 调用 Unix 的 unlink 函 数 。 




















my_pxsem_fifo/sem_unlink.c 


1 #include "unpipc.h" 

2 #include "Semaphore.h" 

3 int 

4 sem unlink(const char *pathname) 
5 { 

6 return (unlink (pathname) ) ; 

7 } 


my_pxsem_fifo/sem_unlink.c 





图 10-39 sem_unlink ek Zi 


10.14.4 sem posti Zi 


图 10-40 给 出 了 我 们 的 sem_post 函 数 ， 由 它 将 某 个 信号 量 


> p Eg 





11—12 ” 往 与 由 调用 者 指定 的 


EJE 


的 值 加 1。 
相关 联 的 FIFO 中 写 入 一 个 任意 


字 节 。 如 果 该 FIFO 先 前 是 空 的， 那么 这 个 写 入 操作 将 唤醒 阻 压 在 该 
FIFO 上 的 read 调 用 中 等 竺 一 个 数据 字 节 的 任意 进程 。 





1 #include 
2 #include 


"unpipc.h" 
"Semaphore .hn 
int 

sem post(sem t *sem) 


char C; 


7 if (sem->sem magic != SEM MAGIC) 
8 errno - EINVAL; 

9 return(-1); 

10 ) 


if (write(sem-»sem fd[1], &c, 1) 


12 return(0); 
13 return(-1); 
14 } 


{ 


esq 


my pxsem fifo/sem post.c 





my pxsem fifo/sem post.c 


图 10-40 sem_post 函 数 


10.14.5 sem wait Zi 


图 10-41 给 出 了 我 们 的 最 后 一 个 函数 sem_wait。 





1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem wait(sem t *sem) 

5 { 

6 char c 

7 if (sem->sem_magic != SEM_MAGIC) { 
8 errno = EINVAL; 

9 return (-1); 

10 } 
du if (read(sem-»sem fd[0], &c, 1) -- 1) 


12 return(0); 
13 return(-1); 
14 } 


my pxsem fifo/sem wait.c 





my pxsem fifo/sem wait.c 


10-41 sem waitrK 2X 


> p Eg 





11~12 从 与 由 调用 者 指定 的 
如 果 该 FIFO 已 为 空 ， 那 就 阻塞 。 


H JÆ 


相关 联 的 FIFO 中 read 1 个 字 节 ， 





我 们 没有 实现 sem_trywait 函 数 ， 但 是 通过 局 用 与 其 信号 量 关 联 的 
FIFO 的 非 阻塞 标志 后 再 调用 read， 就 能 做 到 。 我 们 也 没有 实现 
sem getvaluePK Zi, ?4)]5H]statekfstateK ZH], E Sc HR l4 gk d 
个 管道 或 FIFO 中 的 字 节 数 ， 它 是 作为 所 返回 stat 结 构 的 st_size 成 员 给 出 
的 。 然 而 Posix 并 不 保证 这 一 点 ， 因 而 是 不 可 移植 的 。 下 一 节 中 将 给 出 
XX WI ^ Posixf ^ E EK ZA EIS] SICH o 





10.15 映射 TO 实现 信号 量 





我 们 现在 提供 一 个 使 用 内 存 映 射 TO 以 及 Posix 互 斥 锁 和 条 件 变 量 完 
成 的 Posix 有 名 信号 量 的 实现 。 [IEEE 1996] 的 B.11.3 节 (基本 原理 部 
ay) 中 也 提供 了 一 个 类 似 的 实现 。 

我 们 将 在 第 12 章 和 第 13 间 中 讨论 内 存 上 映射/O。 你 可 能 希望 跳 过 本 
节 ， 到 阅读 完 那 两 章 后 再 返回 来 。 

我 们 首先 在 图 10-42 中 给 出 自己 的 semaphore.h 头 文件 ， 它 定义 了 基 
本 的 sem_t 数 据 类 型 。 














my_pxsem_mmap/semaphore.h 





al /* the fundamental datatype */ 

2 typedef struct { 

3 pthread mutex t sem mutex; /* lock to test and set semaphore value */ 
4 pthread_cond t sem_cond; /* for transition from 0 to nonzero */ 

5 unsigned int sem_count; /* the actual semaphore value */ 

6 int sem_magic; /* magic number if open */ 

7) sem t; 


8 #define SEM MAGIC 0x67458923 


9 #ifdef SEM FAILED 
10 #undef SEM FAILED 
11 #define SEM FAILED ((sem_t *) (-1)) /* avoid compiler warnings */ 


12 #endif 
my_pxsem_mmap/semaphore.h 





图 10-42 semaphore.h 头 文件 
sem_t 数 据 类 型 
1—7 ”我 们 的 信号 量 数 据 结构 含有 一 个 互 斥 锁 、 一 个 条 件 变量 和 包 
含 本 信号 量 当 前 值 的 一 个 无 符 写 整 数 。 正 如 随 图 10-36 讨 论 的 那样 ， 一 














旦 该 结构 已 被 初始 化 ， 其 sem_magic 成 员 将 含有 SEM_MAGIC 值 。 
10.15.1 sem_open 函 数 
图 10-43 给 出 了 我 们 的 sem_open 函 数 的 前 半 部 分 ， 它 会 创建 一 个 新 
的 信号 量 或 打开 一 个 已 存在 的 信和 号 量 。 





my_pxsem_mmap/sem_open.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 #include «stdarg.h» /* for variable arg lists */ 
4 #define MAX TRIES 10 /* for waiting for initialization */ 
5 sem t * 

6 sem open(const char *pathname, int oflag, ... ) 

734 

8 int fd, i, created, save errno; 

9 mode t mode; 

10 va list ap; 

11 sem t *sem, seminit; 

12 struct stat statbuff; 

13 unsigned int value; 

14 pthread mutexattr t mattr; 

15 pthread condattr t cattr; 
16 created - 0; 

17 sem - MAP FAILED; /* [sic] */ 
18 again: 





[10-43 sem openiK Zi: 前 半 部 分 





19 
20 
21 
22 
23 


24 
25 
26 
21 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 


38 
39 
40 
41 
42 


43 
44 
45 
46 
47 
48 
49 
50 


51 
52 
53 
54 
55 
56 
57 


58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 


if (oflag & O CREAT) ( 


va start(ap, oflag); /* init ap to final named argument */ 
mode = va arg(ap, va mode t) & -S IXUSR; 

value - va arg(ap, unsigned int); 

va end(ap); 


/* open and specify O EXCL and user-execute */ 
fd - open(pathname, oflag | O EXCL | O RDWR, mode | S IXUSR); 
if (fd < 0) { 
if (errno == EEXIST && (oflag & O_EXCL) == 0) 
goto exists; /* already exists, OK */ 
else 
return (SEM FAILED); 
} 
created = 1; 
/* first one to create the file initializes it */ 
/* set the file size */ 
bzero(&seminit, sizeof (seminit) ) ; 
if (write(fd, &seminit, sizeof(seminit)) != sizeof (seminit) ) 
goto err; 


/* memory map the file */ 
sem = mmap (NULL, sizeof(sem t), PROT READ | PROT WRITE, 
MAP_SHARED, fd, 0); 
if (sem == MAP FAILED) 
goto err; 


/* initialize mutex, condition variable, and value */ 
if ( (i = pthread mutexattr init(&mattr)) !- 0) 

goto pthreaderr; 
pthread mutexattr setpshared(&mattr, PTHREAD PROCESS SHARED); 
i - pthread mutex init(&sem-»sem mutex, &mattr); 
pthread mutexattr destroy(&mattr); /* be sure to destroy */ 
if (i t= 0) 

goto pthreaderr; 


if ( (i = pthread condattr init(&cattr)) !- 0) 

goto pthreaderr; 
pthread condattr setpshared(&cattr, PTHREAD PROCESS SHARED); 
i = pthread cond init(&sem-»sem cond, &cattr); 
pthread condattr destroy(&cattr); /* be sure to destroy */ 
if (i != 0) 

goto pthreaderr; 


if ( (sem-»sem count = value) > sysconf( SC SEM VALUE MAX)) { 
errno - EINVAL; 
goto err; 


} 
/* initialization complete, turn off user-execute bit */ 
if (fchmod(fd, mode) == -1) 
goto err; 
close (fd) ; 
sem-»sem magic = SEM MAGIC; 
return (sem) ; 


my_pxsem_mmap/sem_open.c 


图 10-43 (42) 


处 理 可 变 参数 表 

14~23 如 果 调 用 者 指定 了 O_CREAT 标 志 ， 我 们 就 知道 需要 的 是 四 
个 而 不 是 两 个 参数 ， 我 们 已 随 图 5-21 讲 述 过 可 变 参 数 表 和 我 们 的 
va_mode_t 数 据 类 型 。 接 着 关 挥 mode 变 量 中 的 用 户 执行 位 
(S_IXUSR) ， 其 原因 稍 后 讲述 。 

创建 一 个 新 的 信号 量 ， 并 处 理 潜在 的 竞争 状态 

24 一 32 创建 一 个 新 文件 ， 其 名 字 为 调用 者 命名 信号 量 所 用 的 名 
字 ， 同 时 打开 它 的 用 户 执行 位 。 在 调用 者 指定 了 O_CREAT 标 志 的 前 提 
下 ， 如 果 我 们 只 是 打开 该 文件 ， 内 存 映 射 其 内 容 ， 然 后 初始 化 sem_t 绪 
构 的 三 个 成 员 ， 那 就 会 碰 到 一 个 竞争 状态 。 我 们 已 随 图 5-21 描 述 过 该 苋 
争 状态 ， 这 儿 有 所 用 的 处 理 技巧 跟 那 儿 给 出 的 一 样 。 在 图 10-52 中 我 们 还 
会 伴 到 一 个 类 似 的 竞争 状态 。 

设置 文件 大 小 

33~37 通过 往 其 中 写 入 一 个 用 0 填充 的 结构 来 设置 新 创建 文件 的 大 
小 。 既 然 知 道 刚 创建 的 文件 的 大 小 为 0， 于 是 我 们 调用 write 而 不 是 
ftruncate 来 设置 文件 大 小 ， 因 为 正如 我 们 在 13.3 节 中 所 注 ， 当 一 个 普通 
文件 的 大 小 有 竺 增长 时 ，Posix 并 不 保证 ftruncate 能 够 工作 。 

内 存 映射 文件 

38—42 调用 mmap 对 新 创建 的 文件 进行 内 存 上 映射。 该 文件 将 含有 所 
创建 信号 量 sem_t 数 据 结构 的 当前 值 ， 不 过 既然 已 内 存 映 射 了 该 文件 ， 
我 们 就 只 通过 由 mmap 返 回 的 指针 来 访问 它 ， 而 从 不 调用 read 或 write。 

初始 化 sem_t 数 据 结 构 

3—57 ”初始 化 内 存 映 射 文件 中 的 sem_t 数 据 结构 的 三 个 成 员 ， 互 斥 
锁 、 条 件 变量 、 信 和 号 量 的 值 。 既 然 Posix 有 名 信和 号 量 可 由 知道 其 名 字 并 
有 足够 权限 的 任意 进程 共享 ， 因 此 在 初始 化 互 斥 锁 和 条 件 变 量 成 员 时 ， 
我 们 必须 指定 PTHREAD_PROCESS_SHARED 属 性 。 对 于 互 斥 锁 成 员 的 


























做 法 是 : 首先 调用 pthread_mutexattr_init 初 始 化 它 的 属性 ， 然 后 调用 
pthread_mutexattr_setpshared 在 该 属性 结构 中 设置 进程 间 共 享 属性 ， 最 后 
调用 pthread_mnutex_init 初 始 化 该 互 斥 锁 。 对 于 条 件 变 量 成 员 也 有 几乎 相 
同 的 做 法 。 我 们 小 心地 保证 在 出 错 情况 下 摊 毁 这 些 属 性 对 象 。 

初始 化 信号 量 值 

58~61 最 后 存 入 信号 量 的 初始 值 ， 我 们 还 把 该 值 与 通过 调用 
sysconf (10.135) 获取 的 最 大 允许 值 作 比 较 。 

关 掉 用 户 执行 位 

62—67 ”完成 信号 量 的 初始 化 后 ， 关 掉 用 户 执 行 位 。 它 指示 信和 与 量 
已 初始 化 完毕 的 状态 。 接 着 close 已 内 存 上 映射 了 的 文件 ， 因 为 已 没有 保持 
它 继续 打开 着 的 必要 了 。 

图 10-44 给 出 了 我 们 的 sem_open 函 数 的 后 半 部 分 。 在 这 里 处 理 前 面 
提 到 过 的 竞争 状态 的 技巧 与 图 5-23 中 所 用 的 技巧 相同 。 

打开 已 存在 的 信号 量 

69~78 我 们 是 在 调用 者 没有 指定 O_CREAT 标 志 或 者 尽管 指定 了 但 
所 需 信 号 量 已 存在 的 条 eee 无 论 哪 种 情况 下 ， 我 们 都 要 打 
开 一 个 已 存在 的 信号 量 。 我 们 open 含 有 所 需 sem_t 数 据 类 型 的 文件 用 于 
读 和 号 ， Hec ERES ER x 间 中 (使 用 


mmap) 。 
































my_pxsem_mmap/sem_open.c 
69 exists: 


70 if ( (fd = open(pathname, O RDWR)) < 0) { 

yu if (errno -- ENOENT && (oflag & O CREAT)) 

42 goto again; 

73 goto err; 

74 } 

ub sem = mmap (NULL, sizeof (sem t), PROT READ | PROT WRITE, 
76 MAP SHARED, fd, 0); 

77 if (sem -- MAP FAILED) 

78 goto err; 

79 /* make certain initialization is complete */ 
80 for (i = 0; i < MAX TRIES; i++) { 

81 if (stat(pathname, &statbuff) == -1) { 

82 if (errno == ENOENT && (oflag & O CREAT)) { 
83 close (fd); 

84 goto again; 

85 } 

86 goto err; 

87 

88 if ((statbuff.st mode & S IXUSR) == 0) { 

89 close (fd) ; 

90 sem->sem_magic = SEM MAGIC; 

91 return (sem) ; 

92 } 

93 sleep (1) ; 

94 

95 errno = ETIMEDOUT; 

96 goto err; 


97 pthreaderr: 


98 errno = i; 

99 err: 

100 /* don't let munmap() or close() change errno */ 
101 save_errno = errno; 

102 if (created) 

103 unlink (pathname) ; 

104 if (sem != MAP_FAILED) 

105 munmap (sem, sizeof (sem 七 ) ) ; 
106 close (fd) ; 

107 errno = Save errno; 

108 return (SEM FAILED); 

109 } 





my_pxsem_mmap/sem_open.c 


图 10-44 sem_open 函 数 : 后 半 部 分 


现在 可 以 看 出 为 什么 Posix.1 声 称 : “访问 信号 量 的 副本 将 产生 未 定 
义 的 结果 ”。 当 使 用 内 存 映 射 TO 来 实现 有 名 信和 号 量 时 ， 信 和 号 量 〈 即 sem_t 
数据 类 型 ) 会 内 存 映射 到 让 它 打开 着 的 所有 进程 的 地 址 空间 中 。 这 是 由 
E E _open 来 完成 的 。 任 意 一 个 进程 对 
该 信号 量 所 做 的 变动 〈 例 如 改变 它 的 计数 值 ) 由 所 有 其 他 进程 通过 内 存 














映射 当场 看 到 。 要 是 我 们 去 制造 菜 个 sem _t 数 据 结构 的 私 用 副本 ， 那 么 
该 副本 将 不 再 为 所 有 进程 所 共享 。 即 使 我 们 可 能 认为 它 在 工作 (针对 它 
的 信号 量 函 数 也 许 不 会 给 出 错误 ， 至 少 在 调用 sem_close 之 前 有 这 种 可 
能 ， 而 sem_close 是 要 撤销 映射 的 ， 因 此 关闭 私 用 副本 肯定 失败 ) ， 本 进 
程 与 其 他 进程 则 也 不 会 发 生 同步 。 然 而 从 图 1-6 可 注意 到 ， 父 进程 中 的 
内 存 映射 区 罕 越 fork 后 继续 在 子 进 程 中 存留 ， 因 此 由 内 核 完 成 的 从 父 进 
程 到 子 进 程 穿 越 fork 进 行 的 信号 量 复制 是 可 行 的 。 

确保 信号 量 已 初始 化 

79—96 “我 们 必须 等 待 刚才 打开 的 信号 量 完成 初始 化 《〈 以 防 多 个 线 
程 几乎 同时 尝试 创建 同一 个 信号 量 ) 。 为 此 ， 我 们 调用 stat 查 看 内 存 映 
射 文件 的 权限 (stat 结 构 的 st_mode 成 员 ) 。 如 果 它 的 用 户 执行 位 已 关 
挥 ， 那 么 该 信号 量 已 完成 初始 化 。 

出 错 返 回 

97—108 当 出 错时 ， 我 们 小 心地 保证 不 改变 errno 的 值 。 

10.15.2 sem close 函数 

图 10-45 给 出 了 我 们 的 sem_close 函 数 ， 它 只 是 对 先前 映射 的 内 存 区 
调用 munmap。 要 是 调用 者 继续 使 用 由 以 前 的 sem_open 调 用 返回 并 作为 
参数 传递 给 本 函数 的 指针 ， 那 么 它 将 收 到 一 个 SIGSEGV 信 和 号 。 


my_pxsem_mmap/sem_close.c 




















1 #include "unpipc.h" 
2 #include "semaphore.h" 


3 int 
4 sem_close(sem_t *sem) 


5 { 

6 if (sem-»sem magic !- SEM MAGIC) { 
7 errno - EINVAL; 

8 returní-1); 

9 ) 


10 if (munmap(sem, sizeof(sem t)) -- -1) 
T return(-1); 

12 return(0); 

13 } 


my pxsem mmap/sem close.c 





图 10-45 sem closer& Zi 


10.15.3 sem_unlink 函 数 
图 10-46 给 出 了 我 们 的 sem_unlink 函 数 ， 由 它 删 除 与 某 个 信号 量 关 联 


的 名 字 。 





它 仅 仅 调 用 Unix 的 unlink 函 数 。 


my_pxsem_mmap/sem_unlink.c 


1 #include "unpipc.h" 

2 #include "Semaphore.h" 

3 int 

4 sem unlink(const char *pathname) 
5 ( 

6 if (unlink(pathname) -- -1) 
7 return (-1); 

8 return (0); 

9 } 





my_pxsem_mmap/sem_unlink.c 


图 10-46 sem_unlink PA 2X 


10.15.4 sem posti Zi 
110-4725 th f dl Nsem_postrsi Zi, ERAAN SEEL, 
"o REG RU VA e BAO, Bee DA] SEE A fei eT DHL IT EE x 








O 
程 。 
my pxsem mmap/sem post.c 
1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem post(sem t *sem) 


5 { 


int n; 


if (sem-»sem magic !- SEM MAGIC) { 
errno - EINVAL; 
return(-1); 


if ( (n = pthread mutex lock(&sem-»sem mutex)) != 0) { 
errno - n; 
return(-1); 
} 
if (sem->sem_count == 0) 
pthread cond signal(&sem-»sem cond); 
sem->sem_count++; 
pthread_mutex_unlock (&sem->sem_mutex) ; 
return (0) ; 





my_pxsem_mmap/sem_post.c 


图 10-47 sem_post 函 数 











11—18 ”在 修改 由 调用 者 指定 的 信号 量 的 值 之 前 ， 首 先 得 获取 它 的 
互 斥 锁 。 如 果 该 信号 量 的 值 将 从 0 增 为 1， 那 就 调用 pthread_cond_signal 
唤醒 等 待 它 的 任意 一 个 线程 。 

10.15.5 sem_waite Zi 

110-4824 H f dll] sem waite| Zi, "E SEDES [i S E EUER OE 








0. 
my pxsem mmap/sem waitt.c 
1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem wait(sem t *sem) 


6 int n; 

7 if (sem-»sem magic != SEM MAGIC) { 

8 errno - EINVAL; 

9 return(-1); 

10 

15. if ( (n = pthread mutex lock(&sem-»sem mutex)) != 0) ( 
X2 errno = n; 

13 return (-1) ; 

14 } 

15 while (sem->sem_count == 0) 

16 pthread cond wait(&sem-»sem cond, &sem-»sem mutex); 
17 sem-»sem count--; 

18 pthread mutex unlock (&sem-»sem mutex); 

19 return(0); 

20 } 





my pxsem mmap/sem wait.c 


图 10-48 sem waitrK Zi 

11~18 FRANSES SINE, BREN 
互 斥 锁 。 如 果 该 信号 量 的 值 为 0， 那 就 让 调用 线程 睡眠 在 一 个 
pthread_cond_wait 调 用 中 ， 等 竺 另外 某 个 线程 为 该 信号 量 的 条 件 变 量 调 
用 pthread_cond_signal， 到 那 时 该 信号 量 的 值 将 由 那个 线程 从 0 增 为 1。 
该 值 一 旦 大 于 0， 本 函数 惑 将 它 减 1， 然 后 释放 关联 的 互 斥 锁 。 

10.15.6 sem_trywait P% Zi 

图 10-49 给 出 了 我 们 的 sem_trywait 函 数 ， 它 是 sem_wait 函 数 的 非 阻 塞 
版 本 。 


























my_pxsem_mmap/sem_trywait.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 
4 sem trywait(sem t *sem) 
5 { 
6 int Hy mo: 
7 if (sem->sem magic != SEM_MAGIC) { 
8 errno = EINVAL; 
9 return (-1) ; 
10 } 
T1 if ( (n = pthread mutex lock(&sem-»sem mutex)) != 0) { 
T2 errno - n; 
13 return(-1); 
14 } 
15 if (sem->sem_count > 0) { 
16 sem-»sem count--; 
D TC = 0s 
18 ) eise ( 
19 re = -1; 
20 errno - EAGAIN; 
21 ) 
22 pthread mutex unlock(&sem-»sem mutex) ; 
23 return(rc); 
24 ) 





my. pxsem. mmap/sem: irywait.c 
图 10-49 sem_trywait 函 数 

11—22 ”获取 由 调用 者 指定 的 信号 量 的 互 斥 锁 后 检查 它 的 值 。 如 果 
该 值 大 于 0， 那 就 将 它 减 1 并 返回 0。 和 否则 返回 值 为 -1， 同 时 置 errno 为 
EAGAIN. 

10.15.7 sem, getvaluer* Zi 

图 10-50 给 出 了 我 们 的 最 后 一 个 函数 sem_getvalue， 它 会 返回 某 个 信 
号 量 的 当前 值 。 














my_pxsem_mmap/sem_getvalue.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem getvalue(sem t *sem, int *pvalue) 


5 { 


6 int n; 

7 if (sem-»sem magic !- SEM MAGIC) { 
8 errno - EINVAL; 

9 return(-1); 





图 10-50 sem_getvalue 函 数 





Tl if ( (n = pthread mutex lock(&sem-»sem mutex)) != 0) { 


12 errno - n; 

T3 return(-1); 

14 

15 *pvalue = sem-»sem count; 

16 pthread mutex unlock(&sem-»sem mutex); 
I7 return (0) ; 

18 } 





my_pxsem_mmap/sem_getvalue.c 


图 10-50 CD 
11~16 获取 由 调用 者 指定 的 信号 量 的 互 斥 锁 后 返回 它 的 值 。 
从 本 节 提 供 的 实现 可 以 看 出 ， 使 用 信号 量 比 使 用 互 斥 锁 和 条 件 变量 
要 简单 。 








我 们 现在 提供 使 用 System V 信 和 号 量 完成 的 Posix 有 名 信和 号 量 的 又 一 个 
实现 。 既 然 较 早 的 System V 信 号 量 实现 与 较 新 的 Posix 信 号 量 实现 相 比 更 
为 普 志 ， 那 么 本 实现 允许 应 用 程序 在 操作 系统 还 不 文 持 Posix 信 和 号 量 的 
情况 下 就 开始 使 用 它们 。 

我 们 将 在 第 11 章 中 讨论 System Vin sm. MARE EAN eA 
节 ， 到 阅读 完 那 一 章 之 后 再 返回 来 。 

我 们 首先 在 图 10-51 中 给 出 semaphore.h 头 文件 ， 它 定义 了 基本 的 


sem_t 数 据 类 型 。 








my_pxsem_svsem/semaphore.h 





fi /* the fundamental datatype */ 

2 typedef struct { 

3 int sem_semid; /* the System V semaphore ID */ 
4 int sem_magic; /* magic number if open */ 

5 } sem t; 


6 #define SEM MAGIC 0x45678923 


7 #ifdef SEM FAILED 
8 #undef SEM FAILED 


9 #define SEM FAILED  ((sem t *) (-1)) /* avoid compiler warnings */ 

10 #endif 

11 #ifndef SEMVMX 

12 #define SEMVMX 32767 /* historical System V max value for sem */ 
13 #endif 


my pxsem svsem/semaphore.h 





[10-51 semaphore.h 头 文件 


sem_t 数 据 类 型 

1—5 我 们 使 用 仪 由 一 个 成 员 构 成 的 System V 信 号 量 集 来 实现 Posix 
有 名 信号 量 。 这 个 信号 量 数据 结构 包含 对 应 的 System V 信 和 号 量 ID 和 一 个 
FER 〈 我 们 已 随 图 10-36 讨 论 过 魔 数 的 用 途 ) 。 

10.16.1 sem_open f% ži 

图 10-52 给 出 了 我 们 的 sem_open 函 数 的 前 半 部 分 ， 该 函数 创建 一 个 
新 的 信号 量 或 打开 一 个 已 存在 的 信号 量 。 











N He 


#include 
#include 


#include 
#define 


sem t * 


"unpipc.h" 
"semaphore.h" 


«stdarg.h» /* for variable arg lists */ 


my pxsem svsem/sem open.c 


MAX TRIES 10 /* for waiting for initialization */ 


sem open(const char *pathname, int oflag, 


{ 


int 


i, fd, semflag, semid, save_errno; 
key t key; 

mode t mode; 

va list ap; 

sem t *sem; 

union semun arg; 
unsigned int value; 
struct semid ds seminfo; 
struct sembuf initop; 


/* no mode for sem open() w/out O CREAT; guess */ 


semflag - SVSEM MODE; 
semid = -1; 


if ( 


oflag & O CREAT) { 
va start(ap, oflag) ; 
mode = va_arg(ap, va mode t); 
value = va_arg(ap, unsigned int); 
va_end (ap); 


/* init ap to final named argument */ 


/* convert to key that will identify System V semaphore */ 


if ( (fd = open(pathname, oflag, mode)) == -1) 
return(SEM FAILED); 

close(fd); 

if ( (key = ftok(pathname, 0)) == (key t) -1) 


return(SEM FAILED); 


semflag - IPC CREAT | (mode & 0777); 
if (oflag & O EXCL) 
semflag |- IPC EXCL; 


/* create the System V semaphore with IPC EXCL */ 
if ( (semid = semget(key, 1, semflag | IPC EXCL)) >= 0) ( 
/* success, we're the first so initialize to 0 */ 


arg.val = 0; 


if (semctl(semid, 0, SETVAL, arg) -- -1) 


goto err; 


/* then increment by value to set sem otime nonzero */ 


if (value > SEMVMX) { 
errno - EINVAL; 
goto err; 


initop.sem num - 0; 
initop.sem op = value; 


initop.sem flg - 0; 
if (semop(semid, &initop, 1) -- -1) 
goto err; 
goto finish; 
) else if (errno !- EEXIST || (semflag & IPC EXCL) 


goto err; 
/* else fall through */ 


图 10-52 sem_open K Zi: 


l= 0) 


my pxsem svsem/sem open.c 


创建 一 个 新 的 信号 量 ， 处 理 可 变 长 度 参 数 表 

20~24 如 果 调 用 者 指定 了 O_CREAT 标 志 ， 我 们 就 知道 需要 的 是 四 
个 而 不 是 两 个 参数 。 我 们 已 随 图 5-21 描 述 过 可 变 长 度 参数 表 的 处 理 和 我 
们 的 va_mode t 数 据 类 型 。 

创建 辅助 文件 ， 将 其 路 径 名 映射 成 System V IPC 键 

25~30 创建 一 个 普通 文件 ， 其 路 径 名 为 调用 者 命名 Posix 信 和 号 量 所 
用 的 名 字 。 创 建 该 文件 的 目的 只 是 为 了 有 一 个 路 径 名 可 供 ftok 用 来 标识 
该 信号 量 。 调 用 者 给 该 信号 量 指定 的 oflag 参 数 可 以 是 O_CREAT 或 
O_CREAT | O_EXCL， 它 用 在 打开 辅助 文件 的 open 调 用 中 。 这 样 ， 如 果 
该 文件 尚未 存在 ， 那 就 创建 它 ， 如 果 该 文件 已 存在 而 且 调用 者 指定 了 
O_EXCL 标 志 ， 那 就 返回 一 个 错误 。 接 着 关闭 该 文件 的 描述 符 ， 因 为 该 
文件 的 唯一 用 途 是 作为 ftok 的 参数 ， 由 ftok 将 其 路 径 名 转换 成 一 个 System 
VIPC 键 (3.277) 。 

创建 仅 有 一 个 成 员 的 System V 信 号 量 

31—33 把 O_CREAT 和 O_EXCL 这 两 个 常 值 转换 成 对 应 的 System V 
IPC_xxx 常 值 后 ， 调 用 semget 创 建 一 个 仅 由 单个 成 员 构 成 的 System VÍŠ 
号 量 集 。 我 们 总 是 指定 IPC_EXCL 标 志 ， 目 的 是 为 了 确定 该 System VÍŠ 
是 否 存在 。 
初始 化 信号 量 
34—50 11.2 节 将 叙述 初始 化 System V 信 号 量 时 存在 的 一 个 基本 问 
题 ，11.6 节 将 给 出 避免 其 中 潜在 的 竞争 状态 的 代码 。 这 儿 使 用 类 似 的 技 
巧 。 尝 试 创建 那个 System V 信 号 量 的 第 一 个 线程 (回想 一 下 ， 我 们 调用 
semget 时 总 是 指定 IPC_EXCL) 将 使 用 semctl 的 SETVAL 命 令 将 它 初始 化 
为 0， 然 后 调用 semop 把 它 设置 成 由 调用 者 指定 的 初始 值 。 该 信号 量 的 
sem_otime 值 保证 由 semget 初 始 化 为 0， 然 后 由 创建 者 的 semop 调 用 设置 
成 某 个 非 零 值 。 这 样 一 来 ， 发 现 该 信号 量 已 经 存在 的 任何 其 他 线程 一 旦 
看 到 该 信号 量 的 sem_otime 值 不 为 0， 就 可 以 肯定 它 已 完成 初始 化 。 
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检查 初始 值 

40—44 我 们 检查 由 调用 者 指定 的 初始 值 ， 因 为 System V 信 号 量 通常 
作为 unsigned short 整 数 存 放 《〈 见 11.1 节 中 的 sem 结 构 ) ， 有 一 个 32767 的 
最 大 值 〈11.7 节 ) ，Posix 信 号 量 则 通常 作为 普通 整数 存放 ， 人 允许 的 值 可 
能 更 大 (10.13 节 ) 。 有 些 System V 实 现 把 常 值 SEMVMX 定 义 成 最 大 的 
言 号 量 值 ， 如 果 系 统 没 有 定义 该 常 值 ， 我 们 就 在 图 10-51 中 把 它 定 义 为 
32767。 

51~53 如 果 所 需 的 System V 信 号 量 已 经 存在 ， 而 且 调用 者 没有 指定 
O_EXCL， 那 就 不 算出 错 。 

这 种 情形 下 ， 代 码 将 落 入 用 于 打开 《而 不 是 创建 ) 已 存在 信号 量 的 
那 部 分 。 

图 10-53 给 出 了 我 们 的 sem_open 函 数 的 后 半 部 分 。 

打开 已 存在 的 信号 量 

55 ~63 对 于 已 存在 的 待 打 开 Posix 信 号 量 (调用 者 未 指定 O_CREAT 
标志 或 者 尽管 指定 了 该 标志 ， 但 所 需 信 号 量 已 存在 ) ， 我 们 使 用 semget 
打开 与 之 对 应 的 System V 信 和 号 量 。 注 意 ， 当 O_CREAT 标 志 未 指定 时 ， 
sem_open 并 没有 mode 参 数 ， 人 然而 即使 待 打开 的 是 一 个 已 存在 的 信号 
量 ，semget 也 需要 一 个 与 node 参 数 等 价 的 参数 。 在 本 函数 的 开始 处 ， 我 
们 给 变量 semflag 赋 了 个 默认 值 〈 来 自我 们 的 unpipc.h 头 文件 的 
SVSEM_MODE 常 值 ) ， 它 在 调用 者 未 指定 O_CREAT 标 志 时 传递 给 
semget. 

等 待 信号 量 完成 初始 化 

64—72 ”接着 通过 以 IPC_STAT 命 令 循环 调用 semctl， 等 待 该 信号 量 
的 sem_otime 值 变 为 非 零 来 验证 它 已 初始 化 完毕 。 

















my_pxsem_svsem/sem_open.c 





55 /* 

56 * (O CREAT not secified) or 

57 * (O CREAT without O EXCL and semaphore already exists). 
58 * Must open semaphore and make certain it has been initialized. 
59 */ 

60 if ( (key = ftok(pathname, 0)) == (key t) -1) 
61 goto err; 

62 if ( (semid = semget(key, 0, semflag)) == -1) 
63 goto err; 

64 arg.buf - &seminfo; 

65 for (i = 0; i < MAX TRIES; i++) { 

66 if (semctl(semid, 0, IPC STAT, arg) == -1) 
67 goto err; 

68 if (arg.buf-»sem otime !- 0) 

69 goto finish; 

70 sleep(1); 

aL 

72 errno = ETIMEDOUT; 

73 err: 

74 Save errno = errno; /* don't let semctl() change errno */ 
75 if (semid !- -1) 

76 semctl(semid, 0, IPC RMID); 

LA errno - save errno; 

78 return(SEM FAILED); 

79 finish: 

80 if ( (sem = malloc(sizeof(sem t))) -- NULL) 

81 goto err; 

82 sem-»sem semid - semid; 

83 sem-»-sem magic = SEM MAGIC; 

84 return(sem); 

85 ) 


my pxsem svsem/sem open.c 





[10-53 sem openiK Zi: 后 半 部 分 


出 错 返 回 

73~78 发 生 错 误 时 ， 我 们 小 心地 保证 不 改变 errno 的 值 。 

分 配 sem_t 数 据 类 型 

79—84 为 一 个 sem_t 数 据 类 型 分 配 空间 ， 把 所 创建 或 打开 的 System 

V 信 和 号 量 的 ID 存放 到 该 结构 中 。 本 函数 的 返回 值 就 是 指 同 该 sm_t 数 据 类 

型 的 指针 。 

10.16.2 sem_close 函 数 

图 10-54 给 出 了 我 们 的 sem_close 函 数 ， 它 仅仅 调用 free 释 放 早 先 为 
sem t 数 据 类 型 动态 分 配 的 内 存 空间 。 





my_pxsem_svsem/sem_close.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 
3 int 

4 sem close(sem t *sem) 

5 { 

6 


if (sem->sem_magic != SEM MAGIC) { 





图 10-54 sem_close pk XX 





7 errno = EINVAL; 

8 return (-1); 

9 } 

10 sem->sem_magic = 0; /* just in case */ 
11 free (sem) ; 

12 return (0) ; 

13 } 





my_pxsem_svsem/sem_close.c 


图 10-54〈 续 ) 
10.16.3 sem_unlink 函 数 
图 10-55 给 出 了 我 们 的 sem_unlink 函 数 ， 它 删除 与 我 们 的 某 个 Posix 
信号 量 关 联 的 辅助 文件 和 System V 信 和 号 量 。 





my_pxsem_svsem/sem_unlink.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3; aint 
4 sem unlink(const char *pathname) 
5 { 
6 int semid; 
" key t key; 
8 if ( (key = ftok(pathname, 1)) -- (key t) -1) 
9 return(-1); 
10 if (unlink(pathname) -- -1) 
id return(-1); 
12 if ( (semid - semget(key, 1, SVSEM MODE)) -- -1) 
13 return(-1); 
14 if (semctl(semid, 0, IPC RMID) -- -1) 
15 return(-1); 
16 return(0); 
im 





my pxsem svsem/sem unlink.c 


10-55 sem unlinkrK Zi 
获取 与 路 径 名 关联 的 System V 键 
8 一 16 ”ftok 把 调用 者 指定 的 路 径 名 转换 成 一 个 System V IPC 键 。 


linken 数 删 除 与 该 路 径 名 同名 的 辅助 文件 。“〈 我 们 现在 就 删除 该 文 
件 ， 这 样 可 避免 另外 某 个 函数 返回 一 个 错误 。 [7] ) semget 打 开关 联 的 
System V 信 号 量 ， 接 着 由 semct 的 IPC_RMID 命 令 删 除 该 信号 量 。 
10.16.4 sem posti Zi 
图 10-56 给 出 了 我 们 的 sem_post 函 数 ， 它 会 给 某 个 信号 量 的 值 加 1。 
11~16 ”以 单一 操作 调用 semop， 把 由 调用 者 指定 的 信号 量 的 值 加 














1. 
my pxsem svsem/sem post.c 
1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem post(sem t *sem) 
5 { 


6 struct sembuf op; 

7 if (sem->sem magic != SEM MAGIC) { 
8 errno = EINVAL; 

9 return (-1) ; 

10 } 

11 op.sem_num = 0; 

12 op.sem_op = 1; 

13 op.sem flg = 0; 

14 if (semop(sem->sem_semid, &op, 1) < 0) 
I5 return (-1); 

16 return (0); 

iz } 





my pxsem svsem/sem post.c 


图 10-56 sem_post 函 数 


10.16.5 sem wait Zi 
图 10-57 给 出 了 我 们 的 sem_wait 函 数 ， 它 等 待 某 个 信号 量 的 值 超过 











my_pxsem_svsem/sem_wait.c 


1 #include "unpipc.h" 

2 #include "semaphore .hy 

3 int 

4 sem wait(sem t *sem) 

5í 

6 struct sembuf op; 

7 if (sem-»sem magic != SEM MAGIC) { 
8 errno - EINVAL; 

9 return(-1); 

10 } 

l1 op.sem num - 0; 

12 op.sem op - -1; 

13 op.sem flg - 0; 

14 if (semop(sem-»sem semid, &op, 1) < 0) 
15 return(-1); 

16 return(0); 

1:9 Y 





my pxsem svsem/sem wait.c 


[10-57 sem_wait phi 2X 


11—16 ”以 单一 操作 调用 semop， 把 由 调用 者 指定 的 信号 量 的 值 减 








10.16.6 sem, trywaitrA Zi 

图 10-58 给 出 了 我 们 的 sem_trywait 函 数 ， 它 是 sem_wait 函 数 的 非 阻塞 
版 本 。 

13 ”与 图 10-57 中 sem_wait 函 数 的 唯一 差别 是 把 sem_ftg 成 员 指 定 为 
IPC_NOWAIT。 如 果 不 阻 塞 调 用 线程 加 完 成 不 了 所 指定 的 操作 ， 那 么 
semop 的 返回 值 将 是 EAGAIN 错 误 ， 这 也 是 sem_trywait 非 得 阻塞 才能 完 
成 等 待 操作 时 必须 返回 的 错误 。 





my_pxsem_svsem/sem_trywait.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem trywait(sem t *sem) 


5 { 


6 struct sembuf op; 

7 if (sem->sem magic != SEM MAGIC) { 
8 errno = EINVAL; 

9 return (-1); 

10 } 

T op.sem num - 0; 

12 op.sem op - -1; 

13 op.sem flg - IPC NOWAIT; 

14 if (semop(sem->sem_semid, &op, 1) < 0) 
15 return(-1); 

16 return(0); 

27 th 








my pxsem svsem/sem trywailt.c 


图 10-58 sem_trywait Pi 2 
10.16.7 sem_getvalue cf Zi 
图 10-59 给 出 了 我 们 的 最 后 一 个 函数 sem_getvalue， 它 返回 某 个 信和 号 
量 的 当前 值 。 








my_pxsem_svsem/sem_getvalue.c 


1 #include "unpipc.h" 

2 #include "Semaphore.h" 

3 int 

4 sem getvalue(sem t *sem, int *pvalue) 
5 { 

6 int val; 

7 if (sem-»sem magic !- SEM MAGIC) { 
8 errno - EINVAL; 

9 return(-1); 

10 ) 

den if ( (val = semctl(sem-»sem semid, 0, GETVAL)) < 0) 
12 return(-1); 

23 *pvalue - val; 

14 return(0); 

15 } 





my pxsem svsem/sem getvalue.c 


图 10-59 sem_getvalue 函 数 


11~14 由 调用 者 指定 的 信号 量 的 当前 值 使 用 semct 的 GETVAL 命 令 
获取 。 








10.17 小 结 


Posix 信 号 量 是 计数 信号 量 ， 它 提供 以 下 三 种 基本 操作 : 

(1) 创 建 一 个 信和 号 量 ; 

(2) 等 待 一 个 信号 量 的 值 变 为 大 于 0， 然 后 将 它 的 值 减 1; 

(3) 给 一 个 信号 量 的 值 加 1， 并 唤醒 等 待 该 信号 量 的 任意 线程 ， 以 此 
挂 出 该 信号 量 。 

Posix 信 号 量 可 以 是 有 名 的 ， 也 可 以 是 基于 内 存 的 。 有 名 信和 号 量 总 
是 能 够 在 不 同 进程 间 共 享 ， 基 于 内 存 的 信号 量 则 必须 在 创建 时 指定 成 是 
售 在 进程 间 共 享 。 这 两 类 信号 量 的 持续 性 也 有 差别 : 有 名 信和 号 量 至 少 有 
随 内 核 的 持续 性 ， 基 于 内 存 的 信号 量 则 具有 随 进程 的 持续 性 。 

生产 者 -消费 者 问题 是 演示 信号 量 的 经 典 例子 。 本 章 中 ， 解 决 这 个 
问题 的 第 一 个 方案 只 有 一 个 生产 者 线程 和 一 个 消费 者 线程 ， 下 一 个 方案 
允许 多 个 生产 者 线程 和 单个 消费 者 线程 ， 最 后 一 个 方案 则 允许 多 个 消费 
者 线程 。 我 们 接着 指出 ， 双 绥 冲 这 个 经 典 问题 仪 仅 是 生产 者 -消费 者 问 
题 的 一 个 特例 ， 该 问题 涉及 的 生产 者 和 消费 者 都 是 单个 的 。 

本 章 最 后 提供 了 Posix 信 号 量 的 三 种 示例 实现 。 使 用 FIFO 完 成 的 第 
一 种 实现 是 最 简单 的 ， 因 为 内 核 提供 的 read 和 write 函数 处 理 了 不 少 同步 
需求 。 第 二 种 实现 使 用 内 存 映 射 /O 完 成 ， 这 与 5.8 节 中 提供 的 Posix 消 费 
队列 的 实现 类 似 ， 其 中 的 同步 使 用 互 斥 锁 和 条 件 变量 进行 。 最 后 一 种 实 
现 使 用 System V 信 号 量 完 成 ， 它 同时 提供 了 访问 System V 信 号 量 的 一 个 
更 简单 的 接口 。 



























































习题 


10.1 如 下 修改 10.6 节 中 的 produce 和 consume 函 数 。 首 先 ， 对 换 消 费 
者 程序 中 两 个 Sem_wait 的 顺序 以 引发 死 锁 正如 10.6 市 中 讨论 的 那 


RE) 。 其 次 ， 在 每 个 Sem_wait 调 用 之 前 加 一 个 printf 调 用 ， 以 指出 哪个 
线程 〈 生 产 者 或 消费 者 ) 在 等 待 哪个 信号 量 。 在 这 些 Sem_wait 调 用 之 后 
再 加 一 个 printf 调 用 ， 以 指出 取得 了 相应 信号 量 的 线程 。 把 缓冲 区 的 数 
目 减 少 到 2， 然 后 构造 并 运行 该 程序 ， 以 验证 它 会 导致 死 锁 。 

10.2 ”假设 启动 图 9-2 中 的 程序 的 4 个 副本 ， 而 该 程序 调用 的 my_lock 
函数 来 自 图 10-19: 

% lockpxsem & lockpxsem & lockpxsem & lockpxsem & 

这 4 个 进程 都 以 值 为 0 的 initflag 启 动 ， 因 此 每 个 进程 调用 sem_open 时 
都 指定 了 O_CREAT 标 志 。 这 样 可 行 吗 ? 

10.3 上 一 道 习 题 中 ， 要 是 有 一 个 进程 在 调用 my_lock 之 后 但 在 调用 
my_unlock 之 前 终止 ， 那 么 会 发 生 什么 ? 

10.4 在 图 10-37 中 ， 要 是 我 们 没有 把 那 两 个 描述 符 都 初始 化 为 -1， 那 
么 会 发 生 什么 ? 

10.5 在 图 10-37 中 ， 我 们 为 什么 移 保 存 errno 的 值 ， 稍 后 再 恢复 ， 而 
不 是 把 那 两 个 close 调 用 改 为 : 

if (sem->fd[0] >= 0) 
close(sem->fd[0]); 

if (sem->fd[1] >= 0) 
close(sem->fd[1]); 

10.6 “如果 有 两 个 进程 几乎 同时 调用 我 们 的 sem_open 的 FIFO 实 现 版 
本 (图 10-37) ， 而 且 都 指定 O_CREAT 标 志和 初始 值 5， 那 么 会 发 生 什 
么 ? 相应 的 FIFO 有 可 能 被 〈 不 正确 地 ) 初始 化 为 10 吗 ? 

10.7 对 于 图 10-43 和 图 10-44， 我 们 描述 过 当 有 两 个 进程 几乎 同时 党 
试 创 建 一 个 信号 量 时 可 能 存在 的 一 种 竞争 状态 。 然 而 在 上 一 道 习 题 的 解 
答 中 ， 我 们 说 图 10-37 不 存在 苋 搜 状态 。 请 解释 。 

10.8 Posix.1 规 定 了 sem_wait 的 一 个 可 选 功能 : 检测 自己 已 被 一 个 捕 
获 的 信号 中 断 并 返回 EINTR 错 误 。 编 写 一 个 测试 程序 ， 判 定 你 的 系统 上 











的 实现 是 否 进行 这 种 检测 。 

再 针对 我 们 的 几 种 实现 运行 你 的 测试 程序 ， 它 们 有 使 用 FIFO 的 
(10.1447) 、 使 用 内 存 映 射 /O 的 《10.15 节 )〉 和 使 用 System V 信 号 量 的 
(10.16 节 ) 。 

10.9 我 们 的 3 种 sem_post 实 现 中 ， 哪 种 是 异步 信号 安全 的 (图 5- 
10) ? 

10.10 修改 10.6 节 中 使 用 的 生产 者 -消费 者 解决 方案， 将 mutex 变 量 改 
为 使 用 pthread_mutex_t 数 据 类 型 ， 而 不 是 使 用 信号 量 。 在 性 能 上 发 生 了 
可 测量 到 的 变化 了 吗 ? 

10.11 ”比较 有 名 信号 量 〈 图 10-17 和 图 10-18) 和 基于 内 存 的 信号 量 
《图 10-20) 的 定时 结果 。 








11% System V 信 号 量 


我 们 在 第 10 章 中 讲述 信号 量 的 概念 时 ， 首 先 讨论 的 是 

二 值 信 号 量 (binary semaphore) : 其 值 或 为 0 或 为 1 的 信号 量 。 这 与 
ARS (第 7 章 ) 类 似 ， 大 资源 被 锁 住 则 信号 量 值 为 0， 寿 资源 可 用 则 信 
号 量 值 为 1。 

接着 把 这 种 信号 量 扩展 为 

计数 信号 量 (counting semaphore) : 其 值 在 0 和 某 个 限制 值 〈 对 于 
ead: 该 值 必须 至 少 为 32767) 之 间 的 信号 量 。 我 们 使 用 这 些 信 

量 在 生产 者 -消费 者 问题 中 统计 资源 ， 信 和 号 量 的 值 就 是 可 用 资源 数 。 

这 两 种 类 型 的 信号 量 中 ， 等 待 Cwait) 操作 都 等 待 信号 量 的 值 变 为 
ATO; 人 OA Hi Cost) 操作 则 只 是 将 信号 量 的 值 加 1， 从 而 
唤醒 正在 等 人 线程 。 

System ，”V 信 号 量 通过 定义 如 下 概念 给 信号 量 增加 了 另外 一 级 复杂 
度 。 

? 计数 信号 量 集 (set of counting semaphores) : 一 个 或 多 个 信和 号 量 
(构成 一 个 集合 ) ， 其 中 每 个 都 是 计数 信号 量 。 每 个 集合 的 信号 量 数 存 
在 一 个 限制 ， 一 般 在 25 个 的 数量 级 上 “(11.7 节 )〉 。 当 我 们 谈论 “System V 
信号 量 ? 时 ， 押 指 的 是 计数 信号 量 集 。 当 我 们 谈论 “Posix 信 号 量 ?" 时 ， 所 
指 的 是 单个 计数 信号 量 。 

对 于 系统 中 的 每 个 信号 量 集 ， 内 核 维 护 一 个 如 下 的 信息 结构 ， 
义 在 <sys/sem.h> 头 文件 中 。 


struct semid_ds { 




















struct ipc_perm sem perm; /* operation permission struct */ 





struct sem *sem_base; /* ptr to array of semaphores in 
set */ 
ushort sem nsems; /* #of semaphores in set */ 
time_t sem_otime;  /* time of last semop()*/ 
time_t sem_ctime; /* time of creation or last 
IPC_SET */ 
p 
其 中 的 ipc_perm 结 构 已 在 3.3 节 描述 过 ， 它 含有 当前 这 个 特定 信和 与 量 
的 访问 权限 。 








sem 结 构 是 内 核 用 于 维护 东 个 给 定 信号 量 的 一 组 值 的 内 部 数据 结 
构 。 一 个 信号 量 集 的 每 个 成 员 由 如 下 这 个 结构 描述 : 
struct sem { 
ushort_t semval; /* semaphore value,nonnegative */ 
short sempid; ph PID of last successful 
semop(),SETVAL,SETALL */ 
Ushort t semncnt; /* # awaiting semval > current value */ 
ushort t semzcnt; /* # awaiting semval = 0 */ 
js 
注意 sem_base 含 有 指向 某 个 sem 结 构 数 组 的 指针 : 当前 信号 量 集中 
的 每 个 信号 量 对 应 其 中 一 个 数组 元 素 。 
除 维 护 一 个 信号 量 集 内 每 个 信号 量 的 实际 值 之 外 ， 内 核 还 给 该 集合 
中 每 个 信号 量 维护 另外 三 个 信息 : 对 其 值 执行 最 后 一 次 操作 的 进程 的 进 
程 ID、 等 待 其 值 增长 的 进程 数 计数 以 及 等 待 其 值 变 为 0 的 进程 数 计 数 。 
Unix 98 声 称 上 述 这 个 结构 是 匿名 的 。 我 们 给 出 的 名 字 sem 来 目 历 史 
上 的 System V 实 现 。 
我 们 可 以 把 内 核 中 的 茶 个 特定 信号 量 图 解 成 指向 一 个 sem 结 构 数 组 




















的 一 个 semid_ds 结 构 。 如 果 该 信号 量 在 其 集合 中 有 两 个 成 员 ， 那 么 我 们 
将 有 图 11-1 所 示 的 图 解 。 该 图 中 变量 sem_nsems 的 值 为 2， 另 外 该 集合 的 
两 个 成 员 分 别 用 下 标 [0] 和 [1] 标记 。 






















semncnt [1] 
semzcnt [1] 


图 11-1 由 两 组 值 构成 的 茶 个 信和 号 量 集 的 内 核 数据 结构 


11.2 semget pi Z3 
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#include <sys/sem.h> 
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int semget(key_t key,int nsems,int oflag); 
返回 : ARTA AAT, A hA- 

返回 值 是 一 个 称 为 信号 量 标识 符 (semaphore identifier) 的 整数 ， 
semop 和 semctl 函 数 将 使 用 它 。 

nsems 参 数 指定 集合 中 的 信号 量 数 。 如 采 我 们 不 创建 一 个 新 的 信和 号 
量 集 ， 而 只 是 访问 一 个 已 存在 的 集合 ， 那 就 可 以 把 该 参数 指定 为 0。 一 
旦 创建 完 一 个 信号 量 集 ， 我 们 就 不 能 改变 其 中 的 信号 量 数 。 

oflag 值 是 图 3-6 中 给 出 的 SEM_R 和 SEM_A 常 值 的 组 合 。 其 中 R 代 


KIL Cread) ”，A 人 代表“ 改 Calter) ”。 它 们 还 可 以 与 IPC_CREAT 或 
IPC_CREAT | IPC_EXCL 按 位 或 ， 如 随 图 3-4 所 作 的 讨论 。 

当 实 际 操作 为 创建 一 个 新 的 信号 量 集 时 ， 相 应 的 semid_ds 结 构 的 以 
下 成 员 将 被 初始 化 。 

sem_perm 结 构 的 uid 和 cuid 成 员 被 置 为 调用 进程 的 有 效用 户 ID，gid 
和 cgid 成 员 被 置 为 调用 进程 的 有 效 组 ID。 

oflag 参 数 中 的 读 写 权限 位 存 入 sem_perm.mode。 

sem_otime 被 置 为 0，sem_ctime 则 被 置 为 当前 时 间 。 

sem_nsems 被 置 为 nsems 参 数 的 值 。 

与 该 集合 中 每 个 信号 量 关 联 的 各 个 sem 结 构 并 不 初始 化 。 这 些 结构 
是 在 以 SET_VAL 或 SETALL 命 令 调用 semctl 时 初始 化 的 。 

言 写 量 值 的 初始 化 

出 现在 本 书 1990 年 版 所 含 源 代码 中 的 注释 不 正确 地 声称 ， 当 实际 操 
作为 创建 一 个 新 的 信号 量 集 时 ，semget 会 将 该 集合 中 各 个 信号 量 的 值 初 
始 化 为 0。 尽 管 有 些 系 统 确实 把 新 的 信号 量 集 内 各 个 信号 量 的 值 初始 化 
为 0， 这 一 点 却 不 能 保证 做 到 。 实 际 上 早期 的 System  V 实 现 根 本 不 对 信 
号 量 值 进行 初始 化 ， 存 放 新 创建 信号 量 集 的 那 部 分 内 存 空间 最 近 一 次 使 
用 时 的 值 就 是 各 个 信号 量 的 初始 值 。 

semget 的 大 多 数 手 册页 面 根本 不 就 实际 操作 为 创建 一 个 新 的 信号 量 
集 时 各 个 信号 量 的 初始 值 应 为 多 少 说 些 什么 。X/Open XPG3 可 移植 性 指 
南 〈1989 年 ) 和 Unix 98 纠 正 了 这 个 忽略 行为 ， 明 确 地 陈述 semget 并 不 初 
始 化 各 个 信号 量 的 值 ， 这 个 初始 化 必须 通过 以 SET_VAL 命 令 ( 设 置 集 
合 中 一 个 值 ) 或 SETALL 命 令 〈 设 置 集合 中 所 有 值 ) 调用 semct (我 们 
稍 后 摘 述 ) 来 完成 。 

System V 信 号 量 的 设计 中 ， 创 建 一 个 信号 量 集 (semget) 并 将 它 初 
始 化 (semctl) 需 两 次 函数 调用 是 一 个 致命 的 缺陷 。 一 个 不 完备 的 解决 
方案 是 : 在 调用 semget 时 指定 IPC_CREAT |IPC_EXCL 标 志 ， 这 样 只 有 

















一 个 进程 〈 首 先 调用 semget 的 那个 进程 ) 创建 所 需 信 号 量 ， 该 进程 随后 
初始 化 该 信号 量 ， 其 他 进程 会 收 到 来 自 semget 的 一 个 EEXIST 错 误 ， 于 
是 再 次 调用 semget， 不 过 这 次 调用 既 不 指定 IPC_CREAT 标 志 ， 也 不 指定 
IPC_EXCL 标 志 。 

然而 苋 争 状态 依然 存在 。 假 设 有 两 个 进程 几乎 同时 尝试 创建 并 初始 
化 一 个 只 有 单个 成 员 的 信号 量 集 ， 两 者 都 执行 如 下 几 行 标 了 号 的 代码 : 

1 oflag = IPC_CREAT | IPC_EXCL | SVSEM_MODE; 

2 if ( (semid = semget(key,1,oflag))>= 0)1 








/* success,we are the first,so initialize */ 
3 arg.val = 1; 
4 Semctl(semid,0, SETV AL,arg); 
5 } else if (errno == EEXIST){ 
/* already exists,just open */ 
6 semid = Semget(key,1,5SVSEM MODE); 
7 } else 
8 err sys("semget error"); 
9 Semop(semid,...); /* decrement the semaphore by 1 */ 
那么 可 能 发 生 如 下 情形 : 
() 第 一 个 进程 执行 第 1 一 3 行 ， 然 后 被 内 核 阻止 执行 ; 
(2) 内 核 启动 第 二 个 进程 ， 它 执行 第 1、2、5、6、9 行 。 
尽管 成 功 创建 该 信号 量 的 第 一 个 进程 将 是 初始 化 该 信号 量 的 唯一 进 
程 ， 但 是 由 于 它 完 成 创建 和 初始 化 操作 需 花 两 个 步骤 ， 因 此 内 核 有 可 能 
在 这 两 个 步骤 之 间 把 上 下 文 切 换 到 另 一 个 进程 。 这 个 新 切换 来 运行 的 进 











程 随后 可 以 使 用 该 信号 量 〈《 上 述 代码 片段 的 第 9 行 ) ， 但 是 该 信号 量 的 
值 尚未 由 第 一 个 进程 初始 化 。 当 第 二 个 进程 执行 第 9 行 时 ， 该 信号 量 的 


值 是 不 确定 的 。 
羊 运 的 是 存在 绕 过 这 个 竞争 状态 的 方法 。 当 semget 创 建 一 个 新 的 信 


量 集 时 ， 其 semid_ ds 结构 的 sem_otime 成 员 保 证 被 置 为 0。 (System V 
7 is 这 个 事实 很 长 时 间 ，XPG3 和 Unix 98 标 准 也 这 么 说 。) 该 成 
员 只 是 在 semop 调 用 成 功 时 才 被 设置 为 当前 值 。 因 此 ， 上 和 面 例子 中 的 第 
二 个 进程 再 次 成 功 地 调用 semget〈( 上 述 代 码 片 段 的 第 6 行 ) 后， 必须 以 
IPC_STAT 命 令 调 用 semctl。 它 然后 等 待 sem_otime 变 为 非 零 值 ， 到 时 就 
可 断定 该 信号 量 已 被 初始 化 ， 而 且 对 它 进 行 初始 化 的 那个 进程 已 成 功 地 
调用 semop。 这 意味 着 创建 该 信号 量 的 那个 进程 必须 初始 化 它 的 值 ， 而 
且 必 须 在 任何 其 他 进程 可 以 使 用 该 信号 量 之 前 调用 semop。 我 们 在 图 10- 
52 和 图 11-7 中 展示 了 使 用 这 种 技巧 的 例子 。 

Posix 有 名 信号 量 通 过 让 单个 函数 〈sem_open) 创建 并 初始 化 信号 
量 来 避免 上 述 问题 。 而 且 即 使 指定 O_CREAT 标 志 ， 信 号 量 也 只 是 在 尚 
未 存在 的 前 提 下 才 被 初始 化 。 

这 个 洪 在 的 竞争 状态 是 否 构成 问题 还 取 雇 于 应 用 程序 。 有 些 应 用 程 
序 〈 例 如 图 10-21 中 的 生产 者 一 消费 者 程序 ) 由 单个 进程 创建 并 初始 化 
信号 量 。 这 种 情形 下 不 会 存在 苋 争 状态 。 但 是 在 其 他 应 用 程序 (例如 图 
10-19 中 的 文件 上 锁 例子 程序 ) 中 ， 创 建 并 初始 化 信号 量 的 并 不 是 单个 
进程 : 第 一 个 打开 信号 量 的 进程 必须 创建 并 初始 化 它 ， 而 且 必须 避免 竞 
争 状 态 。 








11.3 semop FÃ Zi 


使 用 semget 打 开 一 个 信号 量 集 后 ， 对 其 中 一 个 或 多 个 信号 量 的 操作 
就 使 用 semop 函 数 来 执行 。 


#include <sys/sem.h> 








int semop(int semid,struct sembuf *opsptr,size_t nops); 
返回 : 大 成 功 则 为 0， 奋 出错 则 为 -1 
其 中 opsptr 指 向 一 个 如 下 结构 的 数组 : 


struct sembuf { 


short sem_num; /* semaphore number: 0,1,...,nsems-1 */ 
short sem_op; /* semaphore operation: <0,0,>0 */ 
short sem_flg; p operation flags: 
0,IPC NOWAIT,SEM UNDO */ 
3s 


nops 参 数 指 出 由 opsptr 指 向 的 sembuf 结 构 数组 中 元 素 的 数目 。 
组 中 的 每 个 元 素 给 目标 信号 量 集 内 某 个 特定 的 信和 号 量 指定 eas as 
个 特定 的 信号 量 由 sem_num 指 定 ，0 代 表 第 一 个 元 素 ，1 代 表 第 二 个 
素 ， 依 次 类 推 ， 直 到 nsems-1， 其 中 nsems 是 目标 信号 量 集 me 
的 数目 (也 就 是 创建 该 集合 时 传递 给 semget 的 第 二 个 参数 ) 。 
我 们 仪 仪 保证 sembuf 结 构 含有 所 给 出 的 三 个 成 员 。 它 还 可 能 含有 其 
他 成 员 ， 而 且 各 成 员 并 不 保证 以 我 们 给 出 的 顺序 排序 。 这 意味 着 我 们 绝 
不 能 静态 地 初始 化 这 种 结构 ， 例 如 : 
struct sembuf ops[2] = { 
0,0,0, /* wait for [0] to be 0 */ 
0,1,SEM. UNDO /* then increment [0] by 1 */ 
H 
而 是 必须 使 用 运行 时 初始 化 方法 ， 例 如 : 


struct sembuf ops[2]; 
































ops[0].sem_num = 0; /* wait for [0] to be 0 */ 
ops[0].sem_op = 0; 

ops[0].sem_flg = 0; 

ops[1].sem_num = 0; /* then increment [0] by 1 */ 
ops[1].sem_op = 1; 

ops[1].sem_flg = SEM_UNDO; 

由 内 核 保 证 传递 给 semop 函 数 的 操作 数组 Copsptr) 被 原子 地 执行 


内 核 或 者 完成 所 有 指定 的 操作 ， 或 者 什么 操作 都 不 做 。 我 们 将 在 11.5 节 
中 给 出 这 个 特性 的 一 个 例子 。 

每 个 特定 的 操作 是 由 sem_op 的 值 确定 的 ， 它 可 以 是 负数 、0 或 正 
数 。 在 稍 后 给 出 的 讨论 中 ， 我 们 将 使 用 如 下 术语 。 

semval: 信号 量 的 当前 值 (图 11-1) 。 

semncnt: 等 等 Semval 变 为 大 于 其 当前 值 的 线程 数 〈 图 11-1)。 

semzcnt: 等 待 smval 变 为 0 的 线程 数 〈 图 11-1) 。 

semadj: 所 指定 信号 量 针 对 调用 进程 的 调整 值 。 只 有 在 对 应 本 操作 
的 sembuf 结 构 的 sem_flg 成 员 中 指定 SEM_UNDO 标 志 后 ，semadj 才 会 更 
新 。 这 是 一 个 概念 性 的 变量 ， 它 由 内 核 为 在 其 某 个 信号 量 操作 中 指定 了 
SEM_UNDO 标 志 的 各 个 进程 维护 ， 不 必 存 在 名 为 smadj 的 结构 成 员 。 
[8] 

使 得 一 个 给 定 信号 量 操作 非 阻塞 的 方法 是 ， 在 对 应 的 sembuf 结 构 的 
sem flg 成 员 中 指定 IPC_NOWAIT 标 志 。 在 指定 了 该 标志 ， 并 且 如 果 不 
把 调用 线程 投入 睡眠 就 完成 不 了 这 个 给 定 操作 的 情况 下 ，semop 将 返回 
一 个 EAGAIN 错 误 。 

当 一 个 线程 被 投入 睡眠 以 等 eb N (我 们 将 看 

到 该 线程 既 可 等 待 这 个 信号 量 的 值 变 为 0， 也 可 等 待 它 变 为 大 于 0) ， 如 
ACHR T — 一 个 信号 ， 那 么 其 信和 号 ees n4 ee 
semop 函 数 ， 该 函数 于 是 返回 一 个 EINTR 错 误 。 按 照 UNPVvI 第 124 页 的 术 
语 定 义 ， ae he ed 慢 系 统 调用 (slow ^ system 
call) 。 

当 一 个 线程 被 投入 睡眠 以 等 待 某 个 信号 量 操作 完成 之 时 ， 如 果 该 信 



































号 量 被 另外 某 个 线程 或 进程 从 系统 中 删除 ， 那 么 引起 睡眠 的 semop 函 数 
将 返回 一 个 EIDRM 错 误 ， 表 示 “identifier removed 〈 标 识 符 已 删除 ) ” 


现在 我 们 基于 每 个 具体 指定 外 
0 或 负数 一 一 来 描述 semop 的 操作 。 








(1) 如 果 sem_op 是 正 数 ， 其 值 束 加 到 semval 上。 这 对 应 于 释放 由 某 个 
言 写 量 控制 的 资源 。 

如 果 指 定 了 SEM_UNDO 标 志 ， 那 就 从 相应 信号 量 的 semadj 值 中 减 
掉 sem_op 的 值 。 

(2) 如 果 sem_op 是 0， 那 么 调用 者 希望 等 竺 到 semval 变 为 0。 如 采 
semval 已 经 是 0， 那 就 立即 返回 。 

如 果 semval 不 为 0， 相 应 信号 量 的 semzcnt 值 就 加 1， 调 用 线程 则 被 阻 
考 到 semval 变 为 0〈 到 那 时 ， 相 应 信号 量 的 semzcnt 值 再 减 1) 。 前 面 已 经 
提 到 ， 如 果 指 定 了 IPC_NOWAIT 标 志 ， 调 用 线程 就 不 会 被 投入 睡眠 。 如 
果 某 个 被 捕获 的 信号 中 断 了 引起 睡眠 的 semop 函 数 ， 或 者 相应 的 信号 量 
被 删除 了 ， 那 么 该 函数 将 过 早 地 返回 一 个 错误 。 

(3) 如 果 sem_op 是 负数 ， 那 么 调用 者 希望 等 待 semval 变 为 大 于 或 等 于 
sem_op 的 绝对 值 。 这 对 应 于 分 配 资源 。 

如 果 semval 大 于 或 等 于 sem_op 的 绝对 值 ， 那 就 从 semval 中 减 掉 
sem_op 的 绝对 值 。 如 果 指 定 了 SEM_UNDO 标 志 ， 那 么 sem_op 的 绝对 值 
就 加 到 相应 信号 量 的 semadj 值 上 。 

如 果 semval 小 于 sem_op 的 绝对 值 ， 相 应 信号 量 的 semncnt 值 就 加 1， 
调用 线程 则 被 阻 罕 到 semval 变 为 大 于 或 等 于 sem_op 的 绝对 值 。 到 那 时 该 
线程 将 被 解 了 胆 塞 ， 还 将 从 semval 中 减 挥 sem_op 的 绝对 值 ， 相 应 信号 量 的 
semncnt 值 将 减 1。 如 果 指 定 了 SEM_UNDO 标 志 ， 那 么 sem_op 的 绝对 值 
将 加 到 相应 信号 量 的 semadj 值 上 。 前 面 已 经 提 到 ， 如 果 指 定 了 
IPC_NOWAIT 标 志 ， 调 用 线程 就 不 会 锐 投 入 睡眠 。 男 外 ， 如 果菜 个 被 捕 
获 的 信号 中 断 了 引起 睡眠 的 sem_op 函 数 ， 或 者 相应 的 信号 量 被 删除 了 ， 
那么 该 函数 将 过 早 地 返回 一 个 错误 。 

比较 一 下 这 些 操作 和 Posix 信 和 号 量 允 许 的 操作 ， 可 看 到 Posix 信 号 量 
只 允许 -1 Csem wait) 和 +1 (sem posO 这 两 个 操作 。System V 信 号 量 
允许 信号 量 的 值 增 长 或 减少 不 光 是 1， 而 且 人 允许 等 待 信号 量 的 值 变 为 0。 





与 较为 简单 的 Posix 信 号 量 相 比 ， 这 些 更 为 一 般 化 的 操作 以 及 System V 信 
号 量 可 以 有 一 组 值 的 事实 造成 了 System V 信 号 量 的 复杂 性 。 


11.4 semctl pf Zi 
semctl 函 数 对 一 个 信号 量 执行 各 种 控制 操作 。 


#include <sys/sem.h> 





in.semctl(in.semid,in.semnum,in.cmd,.../.unio.semu.ar.*.); 
返回 : ERIWER LEX) ,. dv 
xi! 

第 一 个 参数 semid 标 识 其 操作 竺 控制 的 信号 量 集 ， 第 二 个 参数 
semnum 标 识 该 信号 量 集 内 的 某 个 成 员 〈0、1 等 ， 直 到 nsems-1) 。 
semnum 值 仅仅 用 于 GETVAL、SETVAL、GETNCNT、GETZCNT 和 
GETPID 命 令 。 

第 四 个 参数 是 可 选 的 ， 取 决 于 第 三 个 参数 cmd (参见 下 面 给 出 的 联 
合 中 的 注释 ) 。 


union semun { 





int val; /* used for SETVAL only */ 
struct semid ds *buf; /* used for IPC SET and IPC STAT */ 
ushort *array; /* used for GETALL and SETALL */ 


h 

这 个 联合 并 没有 出 现在 任何 系统 头 文 件 中 ， 因 而 必须 由 应 用 程序 声 
Hj. (我们 在 图 C.1 中 给 出 的 unpipc.h 头 文件 中 定义 了 它 。) 它 是 按 值 传 
递 的 ， 而 不 是 按 引 用 传递 的 。 也 就 是 说 作为 参数 的 是 这 个 联合 的 真正 
值 ， 而 不 是 指 回 它 的 指针 。 

不 幸 的 是 ， 有 些 系统 (FreeBSD 和 Linux) 在 <sys/sem.h> 头 文件 中 定 
义 了 这 个 联合 ， 从 而 使 编写 可 移植 代码 变 得 困难 。 尽 管 由 这 个 系统 头 文 





件 来 声明 semun 联 合 确实 有 理由 ，Unix 98 还 是 声称 它 必 须 由 应 用 程序 显 
式 声 明 。 

System  V 文 持 下 列 cmd 值 。 除 非 另 外 声明 ， 人 否则 返回 值 为 0 表示 成 
功 ， 返 回 值 为 -1 表示 出 错 。 

GETVAL 把 semval 的 当前 值 作为 函数 返回 值 返 回 。 既 然 信 号 量 决 不 
会 是 负数 (semval 被 声明 成 一 个 unsigned short %0 ， 那 么 成 功 的 返 
值 总 是 非 负 数 。 

SETVAL 把 semval 值 设置 为 arg.val。 如 果 操 作成 功 ， 那 么 相应 信和 号 
量 在 所 有 进程 中 的 信号 量 调整 值 (semadj) 将 被 置 为 0。 

GETPID 把 sempid 的 当前 值 作 为 函数 返回 值 返回 。 

GETNCNT 把 semncnt 的 当前 值 作为 函数 返回 值 返 回 。 

GETZCNT 把 semzcnt 的 当前 值 作为 函数 返回 值 返回 

GETALL 返回 所 指定 信号 量 集 内 每 个 成 员 的 senate, 这 些 值 通过 
arg.array 指 针 返 回 ， 函 数 本 身 的 返回 值 则 为 0。 注 意 ， 调 用 者 必须 分 配 一 
个 unsigned short 整 数 数组 ， 访 数组 要 足够 容纳 所 指定 信号 量 集 内 所 有 成 
员 的 semval 值 的 ， 然 后 把 arg.array 设 置 成 指向 这 个 数组 。 

SETALL 设置 所 指定 信号 量 集中 每 个 成 员 的 semval 值 。 这 些 值 是 通 
过 arg.array 指 针 指定 的 。 

IPC_RMID 把 由 semid 指 定 的 信号 量 集 从 系统 中 删除 掉 。 

IPC SET 设置 所 指定 信号 量 集 的 semid_ds 结 构 中 的 以 下 三 个 成 员 : 
sem_perm.uid、sem_perm.gid 和 sem_perm.mode， 这 些 值 来 自由 arg.buf & 
数 指向 的 结构 中 的 相应 成 员 。semid_ds 结 构 中 的 sem_ctime 成 员 也 被 设置 
成 当前 时 间 。 

IPC_STAT (通过 arg.buf B20) 返回 所 指定 信号 量 集 当 前 的 
semid ds 结构 。 注 意 ， 调 用 者 必须 首先 分 配 一 个 semid_ds 结 构 ， 并 把 
arg.buf 设置 成 指向 这 个 结构 。 




















11.5 简单 的 程 


既然 System V 信 号 量具 有 随 内 核 的 持续 性 ， 于 是 我 们 可 以 通过 编写 
一 组 操纵 它们 的 程序 并 得 看 这 些 程序 的 运行 结果 来 展示 它们 的 用 法 。 信 
号 量 的 值 将 由 内 核 从 我 们 的 某 个 程序 维持 到 下 一 个 程序 。 

11.5.1 semcreate 程 序 

图 11-2 给 出 了 我 们 的 第 一 个 程序 ， 它 只 是 创建 一 个 System V 信 号 量 
集 。-e 命 令 行 选项 指定 IPC_EXCL 标 志 ， 该 集合 中 信和 号 量 的 数目 必须 由 
最 后 一 个 命令 行 参数 指定 。 


svsem/semcreate.c 








1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
a { 
5 int c, oflag, semid, nsems; 
6 oflag - SVSEM MODE | IPC CREAT; 
7 while ( (c = Getopt(argc, argv, "e")) !- -1) ( 
8 switch (c) ( 
9 case 'e!: 
10 oflag |= IPC EXCL; 
TT break; 
12 } 
i 
14 if (optind != argc - 2) 
15 err_quit ("usage: semcreate [ -e ] <pathname> <nsems>") ; 
16 nsems = atoi(argv[optind + 1]); 
17 semid - Semget(Ftok(argv[optind], 0), nsems, oflag); 
18 exit (0); 
19 } 
svsem/semcreate.c 
图 11-2 semcreatef£ FF 
11.5.2 semrmid 程 序 


图 11-3 给 出 的 下 一 个 程序 会 从 系统 中 删除 一 个 信号 量 集 。 删 除 该 集 
合 通过 调用 semctl 函 数 执行 IPC_RMID 命 令 完 成 。 


svsem/semrmid.c 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int semid; 

6 if (argc !- 2) 

x err quit("usage: semrmid <pathname>") ; 
8 semid - Semget(Ftok(argv[1], 0), 0, 0); 
9 Semctl(semid, 0, IPC RMID); 

10 exit (0); 

Has d 


svsem/semrmid.c 


11-3 semrmidrf Zi 


11.5.3 semsetvalues 程 序 
图 11-4 给 出 的 semsetvalues 程 序 设置 茶 个 信号 量 集中 的 所 有 值 。 


svsem/semsetvalues.c 











1 #include "unpipc.h" 

2; ant 

3 main(int argc, char **argv) 

“4 

5 int semid, nsems, i; 

6 struct semid_ds seminfo; 

y unsigned short  *ptr; 

8 union semun arg; 

9 if (argc « 2) 

10 err quit("usage: semsetvalues «pathname» [ values ... ]"); 
T /* first get the number of semaphores in the set */ 

12 semid - Semget(Ftok(argv[1], 0), 0, 0); 

13 arg.buf - &seminfo; 

14 Semctl(semid, 0, IPC STAT, arg); 

15 nsems - arg.buf-»sem nsems; 

16 /* now get the values from the command line */ 

17 if (argc != nsems + 2) 

18 err quit ("%d semaphores in set, $d values specified", nsems, argc-2) ; 
19 /* allocate memory to hold all the values in the set, and store */ 
20 ptr = Calloc(nsems, sizeof (unsigned short) ) ; 

21 arg.array = ptr; 

22 for (i = 0; i < nsems; i++) 

23 ptr[i] = atoi(argv[i + 2]); 

24 Semctl(semid, 0, SETALL, arg); 

25 exit(0); 

26 } 


svsem/semsetvalues.c 


图 11-4 semsetvalues PK Zi 





取得 集合 中 信和 号 量 的 数目 

11—15 使 用 semget 获 取 所 指定 信号 量 集 的 信号 量 ID 之 后 ， 发 出 一 个 
semctl 的 IPC_STAT 命 令 取 得 该 信号 量 的 semid_ds 结 构 。 其 中 sem_nsems 
成 员 就 是 该 集合 中 信和 号 量 的 数目 。 

设置 所 有 的 值 

19— 24 分 配 一 个 unsigned short 整 数 数组 的 内 存 空间 ， 每 个 集合 成 员 
对 应 一 个 数组 元 素 ， 然 后 把 它们 的 值 从 命令 行 复制 到 数组 中 。 接 着 由 一 
个 semctl 的 SETALL 命 令 设置 该 信号 量 集 内 所 有 成 员 信号 量 的 值 。 

11.5.4 semgetvalues 程 序 

图 11-5 给 出 的 semgetvalues 程 序 取得 并 输出 某 个 信号 量 集 中 的 所 有 











值 。 


svsem/semgetvalues.c 





1 #include "unpipc.h" 

2. dnt 

3 main(int argc, char **argv) 

4 ( 

5 int semid, nsems, i; 

6 struct semid ds seminfo; 

T unsigned short *ptr; 

8 union semun arg; 

9 if (arge != 2) 

10 err quit ("usage: semgetvalues <pathname>") ; 
TL /* first get the number of semaphores in the set */ 
12 semid - Semget(Ftok(argv[1], 0), 0, 0); 

13 arg.buf - &seminfo; 

14 Semctl(semid, 0, IPC STAT, arg); 

15 nsems - arg.buf-»sem nsems; 

16 /* allocate memory to hold all the values in the set */ 
ly ptr - Calloc(nsems, sizeof (unsigned short)); 

18 arg.array - ptr; 

19 /* fetch the values and print */ 
20 Semctl(semid, 0, GETALL, arg); 

21 for (i = 0; i « nsems; i++) 

22 printf("semval[$d] = %d\n", i, ptr[il); 

23 exit (0); 

24 ) 





svsem/semgetvalues.c 





图 11-5 semgetvaluesfz T 


取得 集合 中 信和 号 量 的 数目 

11—15 使 用 semget 获 取 上 所 指定 信号 量 集 的 信号 量 ID 之 后 ， 发 出 一 个 
semctl 的 IPC_STAT 命 令 取得 该 信号 量 的 semid_ds 结 构 。 其 中 sem_nsems 
成 员 就 是 该 集合 中 信和 号 量 的 数目 。 

取得 所 有 的 值 

16~22 分 配 一 个 unsigned short 整 数 数组 的 内 存 空间 ， 每 个 集合 成 员 
对 应 一 个 数组 元 素 ， 然 后 发 出 一 个 semctl 的 GETALL 命 令 获 取 该 信号 量 
集 内 所 有 成 员 信号 量 的 值 。 接 着 输出 所 有 的 值 。 

11.5.5 semops 程 序 


图 11-6 给 出 的 semops 程 序 对 茶 个 信号 量 集 执行 一 数组 的 操作 。 

















Ss vsem/semops. C 








1 #include "unpipc.h" 
2 ant 
3 main(int argc, char **argv) 
a 
5 int c, i, flag, semid, nops; 
6 struct sembuf *ptr; 
7 flag = 0; 
8 while ( (c = Getopt(argc, argv, "nu")) != -1) { 
9 switch (c) { 
10 case 'n': 
La. flag |= IPC_NOWAIT; /* for each operation */ 
12 break; 
13 case tur; 
14 flag |= SEM_UNDO; /* for each operation */ 
LS break; 
16 } 
17 } 
18 if (argc - optind < 2) /* argc - optind = #args remaining */ 
19 err quit("usage: semops [ -n ] [ -u ] <pathname> operation ..."); 
20 semid = Semget (Ftok(argv[optind], 0), 0, 0); 
21 optind++; 
22 nops = argc - optind; 
23 /* allocate memory to hold operations, store, and perform */ 
24 ptr = Calloc(nops, sizeof (struct sembuf)); 
25 for (i = 0; i < nops; i++) { 
26 ptr [i] .sem_num = i; 
27 ptr[il.sem op = atoi(argv[optind + i]); [® «050; Or s0 Rf 
28 ptr[i].sem flg = flag; 
29 } 
30 Semop (semid, ptr, nops) ; 
31 exit (0); 
32 } 
svsem/semops.c 
图 11-6 semopsfz 
AS APA 
命令 行 选项 


7 一 19 -nn 选项 给 每 个 操作 指定 IPC_NOWAIT 标 志 ，-u 选 项 给 每 个 操 


TETRXESEM, UNDO. 3EX£, semop h žit m FRNA sembuf 2i T4 If] fj 
个 成 员 《〈 也 就 是 针对 信号 量 集 内 每 个 成 员 的 操作 ) 指定 一 组 不 同 的 标 














志 ， 但 是 为 了 简单 起 见 ， 我 们 让 这 些 命令 行 选 项 给 所 有 成 员 信 和 号 量 各 目 
的 指定 操作 统一 指定 相应 标志 。 


给 各 个 操作 分 配 内 存 空间 
20~29 使 用 semget 打 开 所 指定 的 信号 量 集 后 ， 分 配 一 个 sembuf 结 构 





数组 ， 命 令 行 中 指定 的 每 个 操作 对 应 一 个 数组 元 素 。 与 前 两 个 程序 不 


同 ， 


本 程序 允许 用 户 指定 少 于 相应 信号 量 集 内 成 员 数 目的 操作 个 数 。 
执行 各 个 操作 

30 semop 在 所 指定 信号 量 集 上 执行 刚才 创建 的 操作 数组 。 

11.5.6 例子 

现在 演示 刚刚 给 出 的 5 个 程序 ， 以 查看 System V 信 号 量 的 某 些 特 


solaris % touch /tmp/rich 

solaris % semcreate -e /tmp/rich 3 
solaris % semsetvalues /tmp/rich 1 2 3 
solaris % semgetvalues /tmp/rich 
semval[0] = 

semval[1] = 2 

semval[2] = 


我 们 首先 创建 一 个 名 为 /mpmich 的 文件 ， 它 将 《通过 ftok) 用 于 标 


识 本 例子 所 用 的 信号 量 集 。semcreate 创 建 一 个 共有 三 个 成 员 的 信号 量 


FR 


semasetvalues 把 它们 的 值 分 别 设置 为 1 、2 和 3， 这 些 值 随 后 由 


semgetvalues 输 出 。 


建 


我 们 接着 演示 在 一 个 信号 量 集 上 执行 一 组 操作 的 原子 性 。 
solaris % semops -n /tmp/rich -1 -2 -4 

semctl error: Resource temporarily unavailable 

solaris % semgetvalues /tmp/rich 

semval[0] = 

semval[1] = 

semval[2] = 


我 们 指 Cn) 和 三 个 操作 ， 每 个 操作 分 别 减 少 刚 创 


音 号 量 集 内 的 茶 个 值 。 第 一 个 操作 可 以 执行 《我们 可 以 从 该 集合 值 为 


1 的 第 一 个 成 员 中 减 掉 1) ， 第 二 个 操作 也 可 以 执行 〈 我 们 可 以 从 该 集合 
值 为 2 的 第 二 个 成 员 中 减 掉 2) ， 但 是 第 三 个 操作 却 无 法 执行 〈 我 们 不 能 
从 该 集合 值 为 3 的 第 三 个 成 员 中 减 掉 4) 。 既 然 最 后 一 个 操作 不 能 执行 ， 
而 且 指定 了 非 阻 塞 标 志 ， 那 么 将 返回 一 个 EAGAIN 错 误 。 (要 是 未 曾 指 
定 非 阻塞 标志 ， 我 们 的 程序 就 只 是 阻塞 。) 我 们 接着 验证 该 集合 中 没有 
值 变动 过 。 尽 管 前 两 个 操作 可 以 执行 ， 但 是 由 于 最 后 一 个 操作 不 能 执 
行 ， 因 此 这 三 个 操作 都 不 执行 。semop 的 原子 性 意味 着 要 么 所 有 操作 都 
执行 ， 要 么 一 个 操作 都 不 执行 。 
下 面 演 示 System V 信 号 量 的 SEM_UNDO 属 性 。 

















solaris % semsetvalues /tmp/rich 1 2 3 设置 成 已 知 值 
solaris % semops -u /tmp/rich -1 -2 -3 给 每 个 操作 指定 


SEM_UNDO 标 志 solaris % semgetvalues /tmp/rich 

semval[0] = 1 当 semops 
终止 时 所 有 变动 都 被 取消 

semval[1] = 2 


semval[2] = 3 


solaris 96 semops /tmp/rich -1 -2 -3 不 指定 SEM_UNDO 
标志 solaris % semgetvalues /tmp/rich 
semval[0] = 0 变动 未 被 


取消 semval[1] = 0 

semval[2] = 0 

我 们 首先 使 用 semsetvalues 把 三 个 信号 量 值 重 新 置 为 1、2 和 3， 然 后 
使 用 semops 指 定 -1、-2 和 -3 三 个 操作 。 这 导致 万 有 三 个 值 都 变 为 0， 但 
是 既然 我 们 给 semops 程 序 指定 了 -u 选 项 ， 那 么 所 有 三 个 操作 都 被 指定 了 
SEM_UNDO 标 志 。 这 么 一 来 ， 这 三 个 成 员 信号 量 的 semadj 值 就 分 别 被 
置 为 1、2 和 3。 后 来 当 semops 程 序 终止 时 ， 这 三 个 semadj 值 就 分 别 加 到 
三 个 成 员 信号 量 的 当前 值 〈 全 为 0) 上 ， 导 致 它们 的 最 终 值 分 别 变 为 1、 











2 和 3， 这 一 点 我 们 用 semgetvalues 程 序 验证 了 。 我 们 接着 再 次 执行 
semops 程 序 ， 不 过 这 次 不 指定 -u 选 项 ， 其 结果 是 当 semops 程 序 终止 时 ， 
所 有 三 个 成 员 信号 量 的 值 都 保持 为 0， 而 不 回复 到 开始 执行 Semops 程 序 
时 的 值 。 


11.6 文件 上 锁 


我 们 可 以 提供 图 10-19 中 my_lock 和 my_unlock 函 数 的 另 一 个 版 本 ， 
它们 使 用 System V 信 和 号 量 实现 。 图 11-7 给 出 了 这 个 版 本 。 





lock/locksvsem.c 





1 #include "unpipc.h" 

2 #define LOCK PATH "/tmp/svsemlock" 

3 #define MAX TRIES 10 

4 int semid, initflag; 

5 struct sembuf postop, waitop; 

6 void 

7 my lock(int fd) 

8 { 

9 int oflag, i; 

10 union semun arg; 

11 struct semid_ds seminfo; 

12 if (initflag == 0) { 

13 oflag = IPC CREAT | IPC_EXCL | SVSEM MODE; 

14 if ( (semid = semget(Ftok(LOCK PATH, 0), 1, oflag)) >= 0) ( 
15 /* success, we're the first so initialize */ 
16 arg.val - 1; 

17 Semctl(semid, 0, SETVAL, arg); 

18 ) else if (errno == EEXIST) { 

19 /* someone else has created; make sure it's initialized */ 
20 semid - Semget(Ftok(LOCK PATH, 0), 1, SVSEM MODE); 
2: arg.buf - &seminfo; 

22 for (i = 0; i < MAX TRIES; i++) ( 

23 Semctl(semid, 0, IPC STAT, arg); 

24 if (arg.buf-»sem otime != 0) 

25 goto init; 

26 sleep(1); 

27 ) 

28 err quit("semget OK, but semaphore not initialized"); 
29 ) eise 

30 err sys("semget error"); 

31 init: 

32 initflag - 1; 

33 postop.sem num - 0; /* and init the two semop() structures */ 
34 postop.sem op = 1; 

35 postop.sem flg - SEM UNDO; 

36 waitop.sem num - 0; 

37 waitop.sem op - -1; 

38 waitop.sem flg - SEM UNDO; 

39 ) 

40 Semop(semid, &waitop, 1); /* down by 1 */ 

4X } 

42 void 

43 my unlock(int fd) 

44 ( 

45 Semop(semid, &postop, 1); /* up by 1 */ 

46 ) 


lock/locksvsem.c 





图 11-7 使 用 System V 信 和 号 量 实现 的 文件 上 锁 





首先 尝试 独占 创建 
13—17 ”我 们 必须 保证 只 有 单个 进程 初始 化 文件 上 锁 信号 量 ， 因 此 
给 semget 指 定 了 IPC_CREATIIPC_EXCL 标 志 。 如 果 创 建成 功 ， 当 前 进程 


就 调用 semctl 将 该 信号 量 的 值 初始 化 为 1。 如 果 有 多 个 进程 几乎 同时 调用 
我 们 的 my_lock 函 数 ， 那 么 只 有 一 个 进程 会 创建 出 文件 上 锁 信号 量 ( 假 
设 它 尚未 存在 ) ， 接 着 初始 化 该 信号 量 的 也 是 这 个 进程 。 

信号 量 已 存在 ， 那 就 打开 它 

18—20 ”对 于 其 他 进程 来 说 ， 第 一 个 semget 调 用 将 返回 一 个 EEXIST 
错误 ， 它 们 于 是 再 次 调用 semget， 不 过 这 次 不 指定 
IPC_CREATIIPC_EXCL 标 志 。 

等 待 信号 量 被 初始 化 

21~28 我 们 遇 到 了 11.2 节 中 讲解 System V 信 号 量 的 初始 化 时 讨论 过 
的 同一 竞争 状态 。 为 避免 该 竞争 状态 ， 发 现 文 件 上 锁 信 号 量 已 存在 的 任 
何 进程 都 必须 以 IPC_STAT 命 令 调用 semctl， 以 查看 该 信号 量 的 
sem_otime 值 。 如 果 该 值 不 为 0， 我 们 就 知道 创建 该 信号 量 的 进程 已 对 它 
初始 化 ， 并 已 调用 semop 〈semop 调 用 在 本 函数 末尾 ) 。 如 果 该 信号 量 
的 Sem_otime 值 仍 为 0 〈 这 种 情况 应 该 非常 罕见 ) ， 我 们 就 sleep 1 秒 再 尝 
试 。 我 们 限制 了 壬 试 次 数 ， 避 人 免 友 生 永 久 睡 虐 。 

初始 化 sembuf 结 构 

33—38 我 们 早先 提 及 ，sembuf 结 构 中 各 成 员 的 排列 顺序 没有 保证 ， 
因此 不 能 静态 地 初始 化 它们 。 当 一 个 进程 首次 调用 my_lock 时 ， 我 们 分 
配 两 个 这 样 的 结构 ， 并 在 运行 时 填写 它们 。 我 们 指定 了 SEM_UNDO 标 
志 ， 这 样 的 话 如 果 某 个 进程 在 持 有 锁 期 间 终 止 了 ， 内 核 会 释放 该 锁 〈 见 
习题 10.3) 。 

在 首次 使 用 时 创建 一 个 信号 量 很 容易 《每 个 进程 尝试 创建 它 ， 但 是 
如 果 它 已 经 存在 ， 那 就 忽略 所 产生 的 错误 ) ， 然 而 在 所 有 进程 都 完成 后 
将 它 删 除 要 困难 得 多 。 在 使 用 序列 号 文件 分 配 作 业 号 的 打印 机 守护 进程 
例子 中 ， 信 号 量 将 一 直 存 在 下 去 。 但 是 其 他 应 用 程序 可 能 希望 一 旦 需要 
上 锁 的 文件 被 删除 ， 其 信号 量 也 被 删除 。 对 于 这 种 情况 ， 使 用 记录 锁 也 
许 比 使 用 信号 量 更 好 。 























跟 System V 消 息 队 列 一 样 ，System V 信 号 量 也 有 特定 的 系统 限制 ， 
其 中 大 部 分 源 自 最 初 的 System VIL (3.855 。 图 11-8 展 示 了 这 些 限 
制 。 第 一 栏 是 含有 相应 限制 值 的 内 核 变 量 的 传统 System VAF- 
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图 11-8 System V 信 和 号 量 的 典型 限制 值 
QD 每 个 复 旧 Cundo) 结构 对 应 一 个 进程 。 一 一 译 者 注 

















Digital Unix 显 然 不 存在 semmnu 限 制 。 
例子 
图 11-9 中 的 程序 确定 图 11-8 中 给 出 的 各 个 限制 值 。 


svsem/limits.c 





1 #include "unpipc.h" 
2 /* following are upper limits of values to try */ 
3 #define MAX_NIDS 4096 /* max # semaphore IDs */ 
4 #define MAX VALUE 1024*1024 /* max semaphore value */ 
5 #define MAX MEMBERS 4096 /* max # semaphores per semaphore set */ 
6 #define MAX NOPS 4096 /* max # operations per semop() */ 
7 #define MAX NPROC Sysconf( SC CHILD MAX) 
8 int 
9 main(int argc, char **argv) 
LO! 4 
11 int i, j, semid, sid[MAX NIDS], pipefd[2]; 
12 int Semmni, semvmx, semmsl, semmns, semopn, semaem, semume, semmnu; 
15 pidt *child; 
14 union semun arg; 
15 struct sembuf ops [MAX NOPS]; 
16 /* see how many sets with one member we can create */ 
17 for (i = 0; i <= MAX NIDS; i++) { 
18 sid[i] = semget(IPC PRIVATE, 1, SVSEM MODE | IPC CREAT); 
19 if (sid[i] == -1) { 
20 semmni = i; 
21 printf ("%d identifiers open at once\n", semmi); 
22 break; 
23 } 
24 } 
25 /* before deleting, find maximum value using sid[0] */ 
26 for (j = 7; j « MAX VALUE; j += 8) { 
27 arg.val = j; 
28 if (semctl(sid[0], 0, SETVAL, arg) -- -1) ( 
29 semvmx = j - 8; 
30 printf ("max semaphore value = %d\n", semvmx); 
31 break; 
32 } 
33 } 
34 for (j = 07 J €; jes) 
35 Semctl(sid[j], 0, IPC RMID); 
36 /* determine max # semaphores per semaphore set */ 
37 for (i = 1; i <= MAX MEMBERS; i++) { 
38 semid = semget (IPC PRIVATE, i, SVSEM MODE | IPC CREAT); 
39 if (semid == -1) { 
40 semmsl = i - 1; 
41 printf ("max of £d members per set\n", semmsl); 
42 break; 
43 } 
44 Semctl(semid, 0, IPC RMID); 
45 ) 
46 /* find max of total # of semaphores we can create */ 
47 semmns = 0; 





图 11-9 确定 System V 信 号 量 上 的 系统 限制 值 





for (i = 0; i < semmni; i++) { 
sid[i] = semget(IPC PRIVATE, semmsl, SVSEM MODE | IPC CREAT); 
if (sid[i] == -1) { 


/* 

* Up to this point each set has been created with semmsl 
* members. But this just failed, so try recreating this 
* final set with one fewer member per set, until it works. 


*/ 
for (j = semmsl - 1; j > 0; j--) { 
sid[i] = semget(IPC PRIVATE, j, SVSEM MODE | IPC CREAT); 
if (sid[i] is =1) ( 
semmns += j; 
printf("max of $d semaphores\n", semmns); 
Semctl(sid[i], 0, IPC RMID); 
goto done; 
) 
) 
err quit("j reached 0, semmns - $d", semmns); 
) 
semmns += semmsl; 
) 
printf("max of $d semaphores\n", semmns) ; 
done: 


for (j = 0; j < i; j++) 
Semctl(sid[j], 0, IPC RMID); 


/* see how many operations per semop() */ 
semid = Semget(IPC PRIVATE, semmsl, SVSEM MODE | IPC CREAT); 
for (i = 1; i <= MAX NOPS; i++) { 
ops[i - 1].sem num - i - 1; 
ops[i - 1].sem op = 1; 
ops[i - 1].sem flg - 0; 
if (semop(semid, ops, i) == -1) { 
if (errno !- E2BIG) 
err sys("expected E2BIG from semop"); 
semopn - i-1; 
printf("max of %d operations per semop()\n", semopn); 
break; 


} 


Semctl(semid, 0, IPC RMID); 


/* determine the max value of semadj */ 

/* create one set with one semaphore */ 
semid - Semget(IPC PRIVATE, 1, SVSEM MODE | IPC CREAT); 
arg.val - semvmx; 
Semctl(semid, 0, SETVAL, arg); /* set value to max */ 
for (i = semvmx - 1; i > 0; i--) { 

ops [0] .sem num = 0; 


ops [0] .sem op = -i; 
ops [0] .sem flg = SEM UNDO; 
if (semop(semid, ops, 1) != -1) { 


semaem = i; 
printf ("max value of adjust-on-exit = %d\n", semaem) ; 
break; 





图 11-9 (HD 








} 


Semctl(semid, 0, IPC RMID); 


/* determine max # undo structures */ 

/* create one set with one semaphore; init to 0 */ 
semid - Semget(IPC PRIVATE, 1, SVSEM MODE | IPC CREAT); 
arg.val - 0; 

Semctl(semid, 0, SETVAL, arg); /* set semaphore value to 0 */ 
Pipe (pipefd) ; 
child = Malloc(MAX NPROC * sizeof (pid_t)); 
for (i = 0; i < MAX NPROC; i++) { 
if ( (child[i] = fork()) == -1) { 
semmnu = i - 1; 
printf ("fork failed, semmnu at least %d\n", semmnu) ; 


break; 
) eise if (child[i] == 0) { 
ops [0] .sem num = 0; /* child does the semop() */ 


ops[0].sem op = 1; 
ops[0].sem flg - SEM UNDO; 
j = semop(semid, ops, 1); /* 0 if OK, -1 if error */ 
Write(pipefd[1]1, &j, sizeof(j)); 
sleep(30); /* wait to be killed by parent */ 
exit (0); /* just in case */ 

} 

/* parent reads result of semop() */ 

Read(pipefd[0], &j, sizeof(j)); 

if {j == -1) { 
semmnu = i; 
printf ("max # undo structures = %d\n", semmnu) ; 
break; 


Semctl(semid, 0, IPC RMID); 
for (j = 0; j <= i && child[j] > 0; j++) 
Kill(child[j], SIGINT); 


/* determine max # adjust entries per process */ 

/* create one set with max # of semaphores */ 
semid - Semget(IPC PRIVATE, semmsl, SVSEM MODE | IPC CREAT); 
for (i = 0; i < semmsl; i++) { 

arg.val = 0; 


Semctl(semid, i, SETVAL, arg); /* set semaphore value to 0 */ 
ops[i].sem num - i; 

ops[i].sem op = 1; /* add 1 to the value */ 

ops[i].sem flg = SEM UNDO; 

if (semop(semid, ops, i + 1) == -1) { 


semume - i; 
printf("max # undo entries per process = %d\n", semume); 
break; 


Semctl(semid, 0, IPC RMID); 
exit(0); 


svsem/limits.c 


图 11-9 CHE) 


11.8 小 结 


从 Posix 信 号 量 到 System V 信 号 量 发 生 了 如 下 变动 。 

(1)System V 信 号 量 由 一 组 值 构成 。 当 指定 应 用 到 某 个 信号 量 集 的 一 
组 信号 量 操作 时 ， 要 么 所 有 操作 都 执行 ， 要 么 一 个 操作 都 不 执行 。 

(2) 可 应 用 到 一 个 信号 量 集 的 每 个 成 员 的 操作 有 三 种 : 测试 其 值 是 否 
为 0、 往 其 值 加 一 个 整数 以 及 从 其 值 中 减 挥 一 个 整数 (假设 结果 值 仍 然 
AEH) 。Posix 信 号 量 所 允许 的 操作 只 是 将 其 值 加 1 或 减 1 (假设 结果 值 
仍然 非 员 ) 。 

(3) 创 建 一 个 System V 信 和 号 量 集 需要 技巧 ， 因 为 创建 该 集合 并 随后 初 
始 化 其 各 个 值 需要 两 个 操作 ， 从 而 可 能 导致 竞争 状态 。 

(4)System V 信 号 量 提供 “ 复 旧 ”特性 ， 访 特性 保证 在 进程 终止 时 逆转 
某 个 信号 量 操作 。 


习题 








11.1 图 6-8 是 对 图 6-6 的 修改 ， 它 接受 用 于 指定 消息 队列 的 标识 符 而 
不 是 路 径 名 。 从 中 看 出 访问 一 个 System V 消 息 队 列 只 需 知 道 其 标识 符 
(前 提 是 有 足够 的 权限 ) 。 对 图 11-6 进 行 类 似 的 修改 ， 以 展示 同样 的 特 
性 也 适用 于 System V 信 号 量 。 

11.2 如 果 LOCK_PATH 文 件 不 存在 ， 那 么 图 11-7 中 的 函数 会 发 生 什 


AA 


[1]. 一 个 进程 可 以 对 某 个 文件 的 特定 字 节 范围 多 次 发 出 F_SETLK 或 
F_SETLKW 命 令 ， 每 次 成 功 与 否 取 雇 于 其 他 进程 当时 是 否 锁 住 该 字 节 范 
围 以 及 锁 的 类 型 ， 而 与 本 进程 先前 是 否 锁 住 该 字 节 范围 无 关 。 也 就 是 
说 ， 后 执行 的 F_SETLK 或 F_SETLKW 命 令 覆 盖 先 执行 的 针对 同一 字 节 
范围 的 同样 两 个 命令 。 另 外 ， 文 件 能 否 读 写 与 相应 的 记录 是 否 被 其 他 进 
程 锁 住 无 关 《〈 前 提 是 劝告 性 上 锁 ) ， 前 者 由 文件 访问 权限 完全 决定 。 这 














就 是 说 ， 一 个 进程 有 可 能 访问 已 被 另 一 个 进程 独占 地 锁 住 的 文件 中 的 记 
录 ， 不 过 役 此 协作 的 进程 应 目 党 地 不 去 执行 违反 上 锁 要 求 的 访问 。 一 一 
译 者 注 


[2]. 调用 进程 已 持 有 的 针对 同一 字 节 范围 的 锁 不 会 妨碍 它 获 取 新 锁 ， 
为 同一 进程 内 ， 后 执行 的 获取 锁 命 令 履 盖 先 执行 的 命令 。 举 例 来 说 ， 如 
条 一 个 进程 针对 同一 字 节 范围 先后 执行 两 个 命令 : F_SETLK (1_type 成 
员 为 F_WRLCK) 和 F_GETLK (1 typek 1 7jEF RDLCKO ， 这 两 个 命令 
之 间 无 其 他 进程 干扰 ， 而 且 它 们 都 执行 成 功 ， 那 么 由 F_GETLK 返 回 的 

1_type 成 员 是 F_UNLCK 而 不 是 F_WRLCK。 HAI 


[3]. 确实 如 此 ， 甚 至 于 所 关闭 的 描述 符 先 前 是 在 其 文件 已 由 本 进程 〈 通 
过 该 文件 的 另 一 个 描述 符 ) 上 锁 后 才 打 开 也 不 例外 。 看 来 删除 锁 时 关键 
的 是 进程 ID， 而 不 是 引用 同一 文件 的 描述 符 数 目 及 打开 目的 〈 只 读 、 只 
tj. BOO 。 既 然 锁 跟 进程 ID 楷 密 关 联 ， 筷 不 能 通过 fork 由 子 进程 继承 
也 就 顺理成章 ， 因 为 父子 进程 上 有 不同 的 进程 ID。 一 一 详 者 注 


[4]. 为 避免 在 子 进程 的 输出 中 出 现 shell 提 示 符 ， 可 以 在 第 34 行 和 第 35 行 
之 间 插 入 一 行 “wait(NULL); wait(NULL);” 以 等 待 两 个 子 进程 终止 。 图 9- 
9、 图 12-10 和 图 12-12 中 的 程序 也 有 类 似 情况 。 


[5] 试想 ， 消 费 者 消费 掉 生 产 者 产生 的 所 有 数据 时 ，nempty 和 nstore 的 值 
肯定 恢复 成 生产 - 消 旨 过程 尚未 开始 时 的 值 ( 分 别 为 NBUFF 和 0〉。 也 束 
是 说 生产 -消费 过 程 的 结束 状态 与 开始 状态 是 一 致 的 。 此 后 所 有 生产 者 
线程 都 执行 第 47 行 的 Sem_wait， 其 中 有 nempty 个 线程 返回 ， 其 余 线程 则 
阻塞 。 未 阻塞 的 线程 要 是 不 执行 第 50 行 的 Sem_post， 已 阻塞 的 线程 将 永 
远 阻 塞 下 去 。 水 远 阻 宫 的 线程 数 于 是 为 生产 -消费 过 程 结束 时 的 
nempty=nproducers-NBUFF。 一 一 译 者 注 


[6]. 生产 -消费 过 程 刚 结束 时 ，nempty 和 nstored 恢 复 为 生产 -消费 过 程 尚 
未 开始 时 的 值 〈 分 别 为 NBUFF 和 0) 。 生 产 者 函数 produce 中 新 增 的 
Sem_post 行 使 得 只 要 有 一 个 生产 者 线程 终止 ，nstored 的 值 就 大 于 0 (4 
所 有 生产 者 线程 都 终止 时 ，nstored 的 值 将 变 为 nproducers) 。 由 于 消费 
者 函数 consume 中 第 77 行 的 Sem_wait 和 第 80 行 的 Sem_post 匹 配 成 对 ， 
此 只 要 nstored 大 于 0， 不 论 有 多 少 个 消费 者 线程 ， 都 能 一 个 也 不 阻塞 地 
全 部 终止 。 所 有 消费 者 线程 都 终止 时 ， 所 有 生产 者 线程 不 一 定 都 已 终 
下， 但 至 少 有 一 个 已 终止 。 一 一 译 者 注 

















[7]. 在 调用 线程 执行 本 函数 期 间 ， 系 统 可 能 切换 针对 同一 信和 号 量 调用 
sem_open 函 数 的 另 一 个 线程 来 运行 。 要 是 把 本 函数 改 为 先 删除 关联 的 
System V 信 号 量 ， 再 删除 辅助 文件 ， 那 么 一 旦 线程 切换 发 生 在 这 两 个 删 
除 操作 之 间 ， 执 行 sem_open 的 线程 将 发 现 所 需 的 Posix 信 号 量 已 存在 

《因为 其 辅助 文件 尚未 删除 ) ， 但 是 与 之 关联 的 System V 信 和 号 量 却 打 不 
开 《〈 因 为 已 被 删除 了 ) ， 于 是 出 错 。 一 一 译 者 注 
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共享 内 存 区 是 可 用 IPC 形 式 中 最 快 的 。 一 旦 这 样 的 内 存 区 映射 到 共 
享 它 的 进程 的 地 址 空间 ， 这 些 进程 间 数 据 的 传递 就 不 再 涉及 内 核 。 然 而 
往 该 共享 内 存 区 存放 信息 或 从 中 取 走 信息 的 进程 间 通 常 需 要 某 种 形式 的 
同步 。 我 们 在 第 三 部 分 中 已 经 讨论 了 各 种 形式 的 同步 : 互 斥 锁 、 条 件 变 
量 、 读 写 锁 、 记 录 锁 、 信 和 号 量 。 

这 里 说 的 “不 再 涉及 内 核 ” 的 含义 是 : 进程 不 再 通过 执行 任何 进入 内 
核 的 系统 调用 来 彼此 传递 数据 。 显 然 ， 内 核 必须 建立 允许 各 个 进程 共享 
该 内 存 区 的 内 存 上 映射 和 关系， 然后 一 直 管理 该 内 存 区 《处 理 页 面 故障 
= 4 

考虑 用 来 传递 各 种 类 型 消息 的 一 个 示例 客户 -服务 器 文件 复制 程序 
中 涉及 的 通 冲 步骤 。 

服务 器 从 输入 文件 读 。 该 文件 的 数据 由 内 核 恋 入 自己 的 内 存 空间 ， 
然后 从 内 核 复 制 到 服务 器 进程 。 

服务 器 往 一 个 管道 、FIFO 或 消息 队列 以 一 条 消息 的 形式 写 入 这 些 数 
据 。 这 些 IPC 形 式 通 常 需要 把 这 些 数 据 从 进程 复制 到 内 核 。 

这 里 使 用 限定 词 “ 通 稼 ?是 因为 Posix 消 息 队 列 可 使 用 内 存 映 射 




















VO (本 章 将 描述 的 mmap 函 数 ) 实现 ， 如 5.8 节 和 习题 12.2 的 解答 中 所 
示 。 在 图 12-1 中 ， 我 们 假设 Posix 消 息 队 列 是 在 内 核 中 实现 的 ， 这 是 另外 
一 种 可 能 实现 。 然 而 管道 、FIFO 和 System V 消 息 队 列 的 write 或 msgsnd 都 
涉及 从 进程 到 内 核 的 数据 复制 ， 它 们 的 read 或 msgrcv 都 涉及 从 内 核 到 进 
程 的 数据 复制 。 

客户 从 该 IPC 通 道 读 出 这 些 数据 ， 这 通常 需要 把 这 些 数据 从 内 核 复 





制 到 进程 。 
最 后 ， 将 这 些 数据 从 由 write 函数 的 第 二 个 参数 指定 的 客户 缓冲 区 复 
制 到 输出 文件 。 





这 里 通常 需要 总 共 四 次 数据 复制 。 而 且 这 四 次 复制 是 在 内 核 和 某 个 
进程 间 进 行 的 ， 往 往 开销 很 大 《 比 纯粹 在 内 核 中 或 单个 进程 内 复制 数据 
的 开销 大 ) 。 图 12-1 展 示 了 客户 与 服务 器 之 间 通 过 内 核 桥 接 的 数据 转 


移 。 


read(). mq receive()  write(). mq send() 
或 msgrcv () "i 


BE msgsnd () 进程 


IPC (管道 、 FIFO 
或 消息 队列 ) 








图 12-1 从 服务 器 到 客户 的 文件 数据 流 
这 些 IPC 形 式 〈 管 道 、FIFO 和 消 恩 队列 ) 的 问题 在 于 ， 两 个 进程 要 
交换 信息 时 ， 这 些 信息 必须 经 由 内 核 传递 。 
通过 让 两 个 或 多 个 进程 共 诗 一 个 内 存 区 ， 共 至 内 存 区 这 种 IPC 形 式 
提供 了 绕 过 上 述 问题 的 办 法 。 当 然 ， 这 些 进 程 必须 协调 或 同步 对 该 共 吾 
内 存 区 的 使 用 。《 共 吝 一 个 公共 的 内 存 区 跟 共享 一 个 硬盘 文件 类 似 ， 例 
如 本 书 所 有 文件 上 锁 例 子 中 都 使 用 的 那个 序列 号 文件 。) 第 三 部 分 讲述 





的 任何 技巧 都 可 用 于 这 样 的 同步 目的 。 

前 面 的 客户 -服务 器 例子 现在 涉及 的 步骤 如 下 。 

服务 器 使 用 〈 壁 如 说 ) 一 个 信号 量 取 得 访问 某 个 共享 内 存 区 对 象 的 
权力 。 

服务 器 将 数据 从 输入 文件 读 入 到 该 共享 内 存 区 对 象 。read 函 数 的 第 
二 个 参数 所 指定 的 数据 缓冲 区 地 址 指向 这 个 共享 内 存 区 对 象 。 

服务 器 读 入 完毕 时 ， 使 用 一 个 信号 量 通知 客户 。 














客户 将 这 些 数据 从 该 共享 内 存 区 对 象 写 出 到 和 输出 文件 中 。 
图 12-2 展 示 了 这 个 情形 。 





共享 内 存 区 


图 12-2 使 用 共享 内 存 区 将 文件 数据 从 服务 器 复制 到 客户 








本 图 中 数据 只 复制 两 次 : 一 次 从 输入 文件 到 共享 内 存 区 ， 另 一 次 从 
共享 内 存 区 到 输出 文件 。 我 们 男 了 一 个 包围 客户 和 该 共享 内 存 区 对 象 的 
虚 框 ， 叉 画 了 男 一 个 包围 服务 器 和 该 共享 内 存 区 对 象 的 虚 框 ， 目 的 是 强 
调 该 共享 内 存 区 对 象 同时 出 现在 客户 和 服务 器 的 地 址 空间 中 。 

使 用 共享 内 存 区 所 涉及 的 概念 对 于 Posix 接 口 和 System VRE ARIE 
似 。 我 们 将 在 第 13 章 中 讲述 前 者 ， 在 第 14 章 中 讲述 后 者 。 

本 章 中 我 们 返回 到 第 9 章 中 开始 介绍 的 序列 号 加 1 的 例子 。 不 过 我 们 
现在 把 序列 号 存放 在 内 存 中 而 不 是 某 个 文件 里 。 

我 们 首先 再 次 强调 ， 默 认 情 况 下 通过 fork 派 生 的 子 进程 并 不 与 其 父 

















进程 共享 内 存 区 。 图 12-3 中 的 程序 让 父子 进程 都 给 一 个 名 为 count 的 全 局 
整数 加 1。 

创建 并 初始 化 信号 量 

12~14 ”创建 并 初始 化 一 个 信号 量 ， 它 保护 我 们 认为 其 为 一 个 共享 
变量 的 对 象 〈 全 局 变量 count) 。 由 于 这 样 的 假设 不 正确 ， 访 信号 量 实 
际 上 并 非 必要 。 注 意 ， 我 们 通过 调用 sem_unlink 从 系统 中 删除 了 该 信号 
量 的 名 字 ， 但 是 尽管 这 么 一 来 删除 了 它 的 路 径 名 ， 对 于 已 经 打开 的 信和 号 
量 却 没有 影响 。 这 样 做 后 即使 本 程序 中 止 了 ， 该 路 径 名 也 已 从 系统 中 删 
除 。 











shm/incr1.c 





1 #include "unpipc.h" 

2 #define SEM_NAME "mysem" 

3 int count = 0; 

4 int 

5 main(int argc, char **argv) 

6 

7 int i, nloop; 

8 sem t *mutex; 

9 if (argc != 2) 
10 err quit("usage: incrl <#loops>") ; 
11 nloop = atoi(argv[1]); 
12 /* create, initialize, and unlink semaphore */ 
13 mutex - Sem open(Px ipc name(SEM NAME), O CREAT | O EXCL, FILE MODE, 1); 
14 Sem unlink(Px ipc name(SEM NAME)); 

15 setbuf (stdout, NULL); /* stdout is unbuffered */ 
16 if (Fork() == 0) { /* child */ 
q7 for (i = 0; i « nloop; i++) { 

18 Sem_wait (mutex) ; 

19 printf ("child: $dWMn", count++) ; 
20 Sem_post (mutex) ; 
21 } 
22 exit (0); 
23 } 
24 /* parent */ 
25 for (i = 0; i < nloop; i++) { 

26 Sem_wait (mutex) ; 

27 printf ("parent: %d\n", count++) ; 

28 Sem_post (mutex) ; 

29 } 

30 exit (0) ; 

31 } 


shm/incr1.c 





图 12-3 父子 进程 都 给 同一 个 全 局 变量 加 1 


把 标准 输出 设置 为 非 缓冲， 然后 fork 

15 ”把 标准 输出 设置 为 非 缓 冲模 式 ， 因 为 父子 进程 都 要 往 它 写 出 结 
果 。 这 样 可 以 防止 这 两 个 进程 的 输出 不 恰当 地 交 插 。 [1] 

16—29 ”父子 进程 都 执行 一 个 循环 ， 该 循环 对 计数 器 执行 指定 次 数 
的 加 1， 并 小 心地 保证 只 在 持 有 保护 它 的 信号 量 时 才 给 该 变量 加 1。 

运行 该 程序 ， 只 查看 系统 在 父子 进程 间 切 换 时 的 输出 ， 我 们 得 到 如 
T4 

child: 0 子 进 程 首 先 运 行 ， 计 数 器 从 0 开始 
计数 








child: 1 


child: 678 

child: 679 

parent: 0 子 进程 被 阻止 ， 父 进程 运行 ， 计 
数 器 从 0 开始 计数 


parent: 1 


parent: 1220 
parent: 1221 


child: 680 父 进程 被 阻止 ， 子 进程 接着 运行 
child: 681 

.. child: 2078 

child: 2079 

parent: 1222 子 进程 被 阻止 ， 父 进程 接着 运行 


parent: 1223 
如 此 等 等 
可 以 看 出 这 两 个 进程 都 有 各 自 的 全 局 变量 count 的 副本 。 每 个 进程 
都 从 该 变量 为 0 的 初始 值 开 始 ， 而 且 每 次 加 1 的 对 象 是 各 自 的 变量 的 副 
本 。 图 12-4 展 示 了 调用 fork 之 前 的 父 进程 。 








int count; 


父 进 程 在 这 里 执行 一 | if (Fork() == 0) { 
/* child */ 


} 


/* parent */ 





图 12-4 调用 fork 之 前 的 父 过 程 
调用 fork 后 ， 子 进程 从 其 父 进 程 数 据 空 间 的 映射 副本 开始 运行 。 图 
12-5 展 示 了 fork 返 回 后 的 两 个 进程 。 


子 进程 
int count; int count; 
if (Fork() == 0) { if (Fork() == 0) { 
/* child */ 7 /* child */ 
ssa TERE e| 。 
} 这 里 执行 } 
ee /* parent */ /* parent */ 
父 进 程 在 un 
这 里 执行 








图 12-5 fork 返 回 之 后 的 父子 进程 
我 们 看 到 父子 进程 都 有 各 自 的 变量 count 的 副本 。 


12.2 mmap, munmap#llmsyncpf 253 


mmap 函 数 把 一 个 文件 或 一 个 Posix 共 享 内 存 区 对 象 映 射 到 调用 进程 
的 地 址 空间 。 使 用 该 函数 有 三 个 目的 : 








() 使 用 普通 文件 以 提供 内 存 映 射 TO (12.382. ; 

(2) 使 用 特殊 文件 以 提供 匿名 内 存 映射 〈12.4 节 和 12.5 节 ) ; 

(3) 使 用 shm_open 以 提供 无 杀 缘 关系 进程 间 的 Posix 共 享 内 存 区 《第 
13 章 ) 。 

#include <sys/mman.h> 

void *mmap(void *addr,size_t len,int prot,int flags,int fd,off_t offset); 

返回 : Ar ATA Ae AE ee HIE, Er Uy 
MAP_FAILED 

HeH addr HY EAR E TEXAS 75 £a Be RY 8 AE RE E E A i SE e 
siete 个 空 指针 ， 这 样 告诉 内 核 和 目 己 去 选择 起 始 地 址 。 无 论 
哪 种 情况 下 ， 该 函数 的 返回 值 都 是 描述 符 f 押 上 映射 到 内 存 区 的 起 始 地 
址 。 

len 是 映射 到 调用 进程 地 址 空间 中 的 字 节 数 ， 它 从 被 映射 文件 开头 
起 第 offset 个 字 节 处 开始 算 。offset 通 常设 置 为 0。 图 12-6 展 示 了 这 个 映射 
KR 


进程 地 址 空间 


高 端 内 存 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ~ 





文件 的 内 存 
映射 部 分 







mmap 的 返回 值 
低 端 内 存 


l 
l 
! 
" 1 
I 
l 
I 
| 文件 的 内 存 
通过 描述 符 应 访问 的 文件 : 映射 部 分 L4 
7 ec, 


图 12-6 内 存 映 射 文件 的 例子 


内 存 映射 区 的 保护 由 prot 参 数 指定 ， 它 使 用 图 12-7 中 的 常 值 。 该 参 
数 的 常见 值 是 代表 读 写 访问 的 PROT_READ | PROT_WRITE。 


PROT READ 数据 可 读 


PROT WRITE 数据 可 写 
PROT EXEC 数据 可 执行 
PROT_NONE 数据 不 可 访问 


图 12-7 mmap 的 prot 参 数 





flags 使 用 图 12-8 中 的 常 值 指定 。MAP_SHARED 或 MAP_PRIVATE 
这 两 个 标志 必须 指定 一 个 ， 并 可 有 选择 地 或 上 MAP_FIXED。 如 采 指 定 


了 MAP_PRIVATE， 那 么 调用 进程 对 被 映射 数据 所 作 的 修改 只 对 该 进程 
可 见 ， 而 不 改变 其 底层 支撑 对 象 〈 或 者 是 一 个 文件 对 象 ， 或 者 是 一 个 共 
享 内 存 区 对 象 ) 。 如 果 指 定 了 MAP_SHARED， 那 么 调用 进程 对 被 映射 
数据 所 作 的 修改 对 于 共享 该 对 象 的 所 有 进程 都 可 见 ， 而 且 确 实 改变 了 其 
底层 文 撑 对 象 。 











MAP SHARED 变动 是 共享 的 


FEN d 


MAP PRIVATE 变动 是 私自 的 
MAP FIXED TE UE addr% 





图 12-8 mmap 的 flags 参 数 

从 移植 性 上 考虑 ，MAP_FIXED 不 应 该 指定 。 如 果 没 有 指定 该 标 
志 ， 但 是 addr 不 是 一 个 空 指针 ， 那 么 addr 如 何 处 置 取 决 于 实现 。 不 为 空 
的 addr 值 通常 被 当 作 有 关 该 内 存 区 应 如 何 具 体 定位 的 线索 。 可 移植 的 代 
码 应 把 addr 指 定 成 一 个 空 指针 ， 并 且 不 指定 MAP_FIXED。 

父子 进程 之 间 共 享 内 存 区 的 方法 之 一 是 ， 父 进程 在 调用 fork 前 先 指 
定 MAP_SHARED 调 用 mmap。Posix.1 保 证 父 进程 中 的 内 存 映射 关系 存留 
到 子 进程 中 。 而 且 父 进程 所 作 的 修改 子 进程 能 看 到 ， 反 过 来 也 一 样 。 我 
们 稍 后 将 给 出 这 样 的 一 个 例子 。 

mmap 成 功 返 回 后 ，fd 参 数 可 以 关闭 。 该 操作 对 于 由 mmap 建 立 的 映 
射 关 系 没有 影 啊 。 

为 从 某 个 进程 的 地 址 空间 删除 一 个 映射 关系 ， 我 们 调用 munmap。 


#include <sys/mman.h> 














int munmap(void *addr,size_t len); 
返回 : ARIU, AF EEA- 
其 中 addr 参 数 是 由 mmap 返 回 的 地 址 ，len 是 映射 区 的 大 小 。 再 次 访 


问 这 些 地 址 将 导致 向 调用 进程 产生 一 个 SIGSEGV 信 号 (当然 这 里 假设 
以 后 的 mmap 调 用 并 不 重用 这 部 分 地 址 空间 ) 。 

如 果 被 映射 区 是 使 用 MAP_PRIVATE 标 志 映 射 的 ， 那 么 调用 进程 对 
它 所 作 的 变动 都 会 被 丢弃 掉 。 

在 图 12-6 中 ， 内 核 的 虚拟 内 存 算 法 保持 内 存 映 射 文件 (一 般 在 硬盘 
上 ) 与 内 存 映 射 区 (在 内 存 中 ) 的 同步 ， 前 提 是 它 是 一 个 
MAP_SHARED 内 存 区 。 这 就 是 说 ， 如 果 我 们 修改 了 处 于 内 存 映射 到 某 
个 文件 的 内 存 区 中 某 个 位 置 的 内 容 ， 那 么 内 核 将 在 稍 后 某 个 时 刻 相应 地 
更 新 文件 。 然 而 有 时 候 我 们 希望 确信 硬盘 上 的 文件 内 容 与 内 存 映 射 区 中 
的 内 容 一 致 ， 于 是 调用 msync 来 执行 这 种 同步 。 


#include <sys/mman.h> 





int msync(void *addr,size_t len, int flags); 
返回 : ARIU, AF EEA- 
A raddrflllen Z BUH ti ARA RREA A RX, AiE AyD 
指定 该 内 存 区 的 一 个 子 集 。flags 参 数 是 图 12-9 中 所 示 各 第 值 的 组 合 。 


执行 异步 写 


"Ee 执行 同步 写 


MS_INVALIDATE | 。 使 高 速 缓存 的 数据 失效 





图 12-9 msync 函 数 的 flags 参 数 
MS_ASYNC 和 MS_SYNC 这 两 个 党 值 中 必须 指定 一 个 ， 但 不 能 都 指 
定 。 它 们 的 差别 是 ， 一 旦 写 操作 已 由 内 核 排 入 队列 ，MS_ASYNC 即 返 
回 ， 而 MS_SYNC 则 要 等 到 写 操作 完成 后 才 返 回 。 如 果 还 指定 了 
MS_INVALIDATE， 那 么 与 其 最 终 副 本 不 一 致 的 文件 数据 的 所 有 内 存 中 
副本 都 失效 。 后 续 的 引用 将 从 文件 中 取得 数据 。 





为 何 使 用 mmap 

到 此 为 止 束 mmap 的 描述 间接 说 明了 内 存 映射 文件 ， 我 们 open 它 之 
后 调用 mmap 把 它 映 射 到 调用 进程 地 址 空间 的 某 个 文件 。 使 用 内 存 映射 
文件 所 得 到 的 奇妙 特性 是 ， 所 有 的 IO 都 在 内 核 的 掩盖 下 完成 ， 我 们 只 
需 编写 存 取 内 存 映射 区 中 各 个 值 的 代码 。 [2] 我 们 决 不 调用 read、write 
或 lseek。 这 么 一 来 往往 可 以 简化 我 们 的 代码 。 

回想 使 用 mmap 完 成 的 Posix 消 息 队 列 的 实现 ， 其 中 图 5-30 有 往 内 存 
映射 区 中 某 个 msg_hdr 结 构 存 入 值 的 代码 ， 图 5-32 有 从 内 存 映 射 区 中 茶 
个 msg_hdr 结 构 取 出 值 的 代码 。 

然而 需要 了 解 以 防 误解 的 说 明 是 ， 不 是 所 有 文件 都 能 进行 内 存 映 
射 。 例 如 ， 试 图 把 一 个 访问 终端 或 套 接 字 的 描述 符 映 射 到 内 存 将 导致 
mmap 返 回 一 个 错误 。 这 些 类 型 的 描述 符 必 须 使 用 read 和 write (或 者 它 
们 的 变 体 ) 来 访问 。 

mmap 的 男 一 个 用 途 是 在 无 杀 缘 关系 的 进程 间 提供 共享 的 内 存 区 。 
这 种 情形 下 ， 所 映射 文件 的 实际 内 容 成 了 被 共享 内 存 区 的 初始 内 容 ， 而 
且 这 些 进程 对 该 共享 内 存 区 所 作 的 任何 变动 都 复制 回 所 映射 的 文件 (以 
提供 随 文件 系统 的 持续 性 ) 。 这 里 假设 指定 了 MAP_SHARED 标 志 ， 它 
是 进程 间 共 享 内 存 所 需求 的 。 

有 关 mmap 的 实现 以 及 它 与 内 核 虚 拟 内 存 算法 之 间 的 关系 具体 参见 
[McKusick et al.1996] 《适用 于 4.4BSD) 以 及 [Vahalia 1996] 和 
[ Goodheart and Cox 1994] (适用 于 SVR4) 。 

















现在 对 (不 工作 的 ) 图 12-3 进 行 修改 ， 以 使 父子 进程 共享 存放 着 计 
数 器 的 一 个 内 存 区 。 为 此 目的 ， 我 们 使 用 一 个 内 存 映 射 文件 ， 我 们 open 
它 之 后 调用 mmap 把 它 映射 到 调用 进程 地 址 空间 的 某 个 文件 。 图 12-10 给 


出 了 这 个 新 程序 。 

新 的 命令 行 参 数 

11—14 新 增 的 命令 行 参数 是 有 待 内 存 映 射 的 一 个 文件 的 名 字 。 我 
们 打开 该 文件 用 于 读 和 写 ， 知 不 存在 则 创建 之 ， 然 后 写 一 个 值 为 0 的 整 
数 到 该 文件 中 。 

mmap 后 关闭 描述 符 

15~16 调用 mmap 把 刚才 打开 的 文件 映射 到 本 进程 的 内 存 空间 。 第 
一 个 参数 是 一 个 空 指针 ， 因 而 由 系统 来 选择 起 始 地 址 。 长 度 参数 是 一 个 
int 的 大 小 ， 保 护 模式 参数 指定 读 写 访问 。 

通过 把 第 四 个 参数 指定 为 MAP_SHARED， 父 进程 所 作 的 任何 变动 
子 进 程 都 能 看 到 ， 反 过 来 也 一 样 。 函 数 返 回 值 是 待 共享 内 存 区 的 起 始 地 
址 ， 我 们 把 它 保存 在 ptr 中 。 

fork 

20~34 把 标准 输出 设置 成 非 绥 冲模 式 后 调用 fork。 父 子 进程 都 要 对 
由 ptr 指 癌 的 整数 计数 器 执行 加 1 操作 。 


shm/incr2.c 





1 #include "unpipc.h" 

2 #define SEM NAME "mysem" 

3 int 

4 main(int argc, char **argv) 

5 { 

6 int fd, i, nloop, zero = 0; 

y int *ptr; 

8 sem t *mutex; 

9 if (argc != 3) 

10 err quit("usage: incr2 <pathname> <#loops>") ; 

24 nloop = atoi(argv[21); 

12 /* open file, initialize to 0, map into memory */ 
13 fd - Open(argv[1], O RDWR | O CREAT, FILE MODE); 

14 Write(fd, &zero, sizeof(int)); 

15 ptr - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
16 Close (fd); 

17 /* create, initialize, and unlink semaphore */ 

18 mutex - Sem open(Px ipc name(SEM NAME), O CREAT | O EXCL, FILE MODE, 1); 
19 Sem unlink(Px ipc name(SEM NAME)); 

20 setbuf (stdout, NULL); /* stdout is unbuffered */ 
2 if (Fork() == 0) { /* child */ 

22 for (i = 0; i < nloop; i++) { 

23 Sem_wait (mutex) ; 

24 printf ("child: d\n", (*ptr) ++); 

25 Sem_post (mutex) ; 

26 } 

27 exit (0); 

28 } 

29 /* parent */ 

30 for (i = 0; i < nloop; i++) { 

31 Sem_wait (mutex) ; 

32 printf ("parent: $dWMn", (*ptr)++); 

33 Sem_post (mutex) ; 

34 } 

35 exit (0) ; 

36 ) 


shm/incr2.c 





图 12-10 父子 进程 给 共享 内 存 区 中 的 一 个 计数 器 加 1 


fork 对 内 存 映射 文件 进行 特殊 处 理 ， 也 就 是 父 进程 在 调用 fork 之 前 
创建 的 内 存 映射 关系 由 子 进程 共享 。 因此， 我 们 刚才 在 打开 文件 后 以 
MAP_SHARED 标 志 调 用 mmap 的 操作 实际 上 提供 了 一 个 由 父子 进程 共享 
的 内 存 区 。 而 且 ， 既 然 该 共享 内 存 区 是 一 个 内 存 映 射 文件 ， 因 而 对 它 
(由 ptr 指 向 的 大 小 为 sizeof(int) 的 内 存 区 〉 所 作 的 任何 变动 还 会 反映 到 
真正 的 文件 中 《该 文件 的 名 字 由 命令 行 参数 指定 ) 。 


执行 这 个 程序 ， 我 们 发 现 由 ptr 指 向 的 内 存 区 确实 在 父子 进程 间 共 
。 下 面 只 给 出 内 核 在 这 两 个 进程 间 来 回 切换 上 下 文 时 输出 的 值 。 

solaris % incr2 /tmp/temp.1 10000 

child: 0 子 进 程 首 先 运行 

child: 1 


y 


child: 128 solaris % od -D /tmp/temp.1 

0000000 0000020000 

0000004 

parent: 130 子 进程 被 阻止 ， 父 进程 启动 
child: 638 父 进程 被 阻止 ， 子 进程 接着 


parent: 1519 子 进程 被 阻止 ， 父 进程 接着 


parent: 19999 最 后 一 行 输出 
parent: 1520 child: 1517 

child: 1518 

child: 639 parent: 636 

parent: 637 

parent: 131 

child: 129 


既然 文件 /mp/temp.1 已 被 内 存 上 映射，incr2 程 序 运行 终止 后 我 们 可 以 
用 od 程序 查看 该 文件 的 内 容 ， 发 现 其 中 确实 存放 着 计数 占 的 最 终 值 
(20000) 。 











图 12-11 是 对 图 12-5 的 修改 ， 它 画 出 了 共享 内 存 区 ， 并 表示 出 信和 号 量 
也 是 共享 的 。 这 里 的 信号 量 男 成 是 在 内 核 中 ， 然 而 正如 我 们 讲述 Posix 
言 号 量 时 提 到 的 那样 ， 这 并 不 是 必须 的 。 不 论 使 用 什么 来 实现 ， 信 和 号 量 
必须 至 少 具 有 随 内 核 的 持续 性 。 如 10.15 节 所 展示 的 那样 ， 该 信号 量 也 
可 作为 另 一 个 内 存 上 映射 文件 存放 。 





享 内 存 区 







int *ptr; 





if (Fork() == 0) { 
/* child */ 


if (Fork() == 0) { 
/* child */ 






子 进程 在 _ 
这 里 执行 















} 








/* parent */ 





父 进程 在 y /* parent */ 
这 里 执行 e 

















图 12-11 共享 一 个 内 存 区 和 一 个 信号 量 的 父子 进程 

图 中 国 出 父子 进程 都 各 自 有 属于 自己 的 指针 ptr 的 副本 ， 但 是 每 个 副 
本 都 指 癌 共享 内 存 区 中 的 同一 个 整数 : 这 两 个 进程 都 对 它 执行 加 1 操作 
的 计数 器 。 

现在 把 图 12-10 中 的 程序 改 为 使 用 一 个 Posix 基 于 内 存 的 信号 量 ， 而 
不 是 一 个 Posix 有 名 信号 量 ， 并 把 该 信号 量 存放 在 共享 内 存 区 中 。 图 12- 
12 给 出 了 这 个 新 程序 。 

定义 将 存放 在 共享 内 存 区 中 的 结构 

2 一 5 “定义 一 个 结构 ， 其 中 含有 整数 计数 器 以 及 保护 它 的 信号 量 。 

结构 将 存放 到 共享 内 存 区 对 象 中 。 


























shm/incr3.c 





1 #include "unpipc.h" 


2 struct shared { 


3 sem t mutex; /* the mutex: a Posix memory-based semaphore */ 
4 int count; /* and the counter */ 

5 ) shared; 

6 int 

7 main(int argc, char **argv) 

8 { 

9 int fd, 1, nloop; 

10 struct shared *ptr; 

11 if (argc != 3) 

12 err quit("usage: incr3 <pathname> <#loops>") ; 

13 nloop = atoi(argv[21); 

14 /* open file, initialize to 0, map into memory */ 
15 fd - Open(argv[1], O RDWR | O CREAT, FILE MODE); 

16 Write(fd, &shared, sizeof(struct shared)); 

27 ptr - Mmap(NULL, sizeof(struct shared), PROT READ | PROT WRITE, 
18 MAP SHARED, fd, 0); 

19 Close (fd) ; 

20 /* initialize semaphore that is shared between processes */ 
2] Sem init(&ptr-»mutex, 1, 1); 

22 setbuf (stdout, NULL); /* stdout is unbuffered */ 
23 if (Fork() == 0) { /* child */ 

24 for (i = 0; i « nloop; i++) { 

25 Sem_wait (&ptr->mutex) ; 

26 printf ("child: d\n", ptr->count++) ; 

27 Sem_post (&ptr->mutex) ; 

28 } 

29 exit (0) ; 

30 } 

31 /* parent */ 

32 for (i = 0; i < nloop; i++) { 

33 Sem_wait (&ptr->mutex) ; 

34 printf ("parent: %d\n", ptr->count++) ; 

35 Sem_post (&ptr->mutex) ; 

36 } 

37 exit (0) ; 

38 } 


shm/incr3.c 











图 12-12 计数 器 和 信号 量 都 在 共享 内 存 区 中 


映射 到 内 存 

14~19 创建 一 个 将 被 映射 到 内 存 的 文件 ， 将 一 个 值 为 0 的 上 述 结构 
写 到 该 文件 中 。 我 们 所 做 的 只 是 初始 化 其 中 的 计数 器 ， 因 为 信号 量 的 值 
古 通 过 调用 sem_init 初 始 化 的 。 然 而 把 整个 结构 写成 0 要 比试 图 只 写 一 个 
值 为 0 的 整数 容易 。 


初始 化 信号 量 

20~21 现在 是 用 一 个 基于 内 存 的 信号 量 代 蔡 一 个 有 名 信和 号 量 ， 因 
此 我 们 调用 sem_init 把 它 的 值 初始 化 为 1。 第 二 个 参数 必须 不 为 0， 以 指 
示 该 信号 量 将 在 进程 间 共 享 。 

图 12-13 是 对 图 12-11 的 修改 ， 注 意 其 中 的 信号 量 已 从 内 核 挪 到 了 共 
享 内 存 区 中 。 








共享 内 存 区 
计数 器 及 其 信号 量 










pl 


子 进程 





struct shared *ptr; struct shared *ptr; 





if (Fork() == 0) { 
/* child */ 






if (Fork() == 0) { 
/* child */ 








子 进程 在 
这 里 执行 






} } 





/* parent */ 
cce s.. 


父 进 程 在 /* parent */ 


这 里 执行 

















图 12-13 现在 计数 器 和 信和 号 量 都 在 共享 内 存 区 中 





12.4 4.4BSDi= HA ES 


图 12-10 和 图 12-12 中 的 例子 程序 工作 正确 ， 然 而 我 们 不 得 不 在 文件 
系统 中 创建 一 个 文件 (其 名 字 由 命令 行 参数 给 出 ) ， 调 用 open， 然 后 往 
该 文件 中 write 一 些 0 以 初始 化 它 。 如 果 调 用 mmap 的 目的 是 提供 一 个 将 罕 
越 fork 由 父子 进程 共享 的 映射 内 存 区 ， 那 么 我 们 可 以 简化 上 述 情形 ， 具 
体 方法 取决 于 实现 。 

(1)4.4BSD 提 供 匿名 内 存 映 射 Canonymous memory mapping) ， 它 
彻底 避免 了 文件 的 创建 和 打开 。 其 办 法 是 把 mmap 的 flags 参 数 指定 成 
MAP SHARED | MAP_ANON， 把 fd 参数 指定 为 -1。offset 参 数 则 被 忽 
略 。 这 样 的 内 存 区 初始 化 为 0。 我 们 将 在 图 12-14 中 给 出 这 种 内 存 映 射 的 


一 个 例子 。 

(2)SVR4 提 供 /dev/zero 设 备 文 件 ， 我 们 open 它 之 后 可 在 mmap 调 用 中 
使 用 得 到 的 描述 符 。 从 该 设备 读 时 返回 的 字 节 全 为 0， 写 往 该 设备 的 任 
何 字 节 则 被 丢弃 。 我 们 将 在 图 12-15 中 给 出 使 用 该 设备 进行 内 存 映射 的 
一 个 例子 。【〔 许 多 源 目 Berkeley 的 实现 也 支持 /dev/zero， 例 如 SunOS 
4.1.x 和 BSD/OS 3.1. ) 

图 12-14 给 出 了 改 用 4.4BSD 匿 名 内 存 映 冉 后 ， 与 图 12-10 中 程序 相 比 
唯一 有 变动 的 部 分 。 


shm/incr_map_anon.c 


3 int 
4 main(int argc, char **argv) 


6 int i, nloop 

7 int ptr; 

8 sem t *mutex; 

9 if (argc != 2) 

10 err quit("usage: incr map anon <#loops>") ; 

11 nloop - atoi(argv[1]); 

12 /* map into memory */ 

13 ptr - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, 
14 MAP SHARED | MAP ANON, -1, 0); 


shm/incr map anon.c 





[12-14 4.4BSD E 44 N TEILS] 
6—11 上 自动 变量 fd 和 zero， 以 及 指定 竺 创建 路 径 名 的 命令 行 参数 都 


MATHS o 
12~14 我 们 不 再 open 一 个 文件 。 在 调用 mmap 时 指定 了 
MAP _ANON 标 志 ， 并 置 第 五 个 参数 〈 描 述 符 ) 为 -1。 


12.5 SVR4 /dev/zero HU Ep 


图 12-15 给 出 了 改 为 映射 /dev/zero 后 与 图 12-10 中 程序 相 比 唯一 有 变 


动 部 分 。 


shm/incr_dev_zero.c 





3 amt 
4 main(int argc, char **argv) 


6 int fd, i, nloop; 

7 int *ptr; 

8 sem t mutex 

9 LE (arga v= 2) 

10 err quit("usage: incr dev zero <#loops>") ; 

abi. nloop - atoi(argv[1]); 

12 /* open /dev/zero, map into memory */ 

13 fd - Open("/dev/zero", O RDWR); 

14 ptr - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
15 Close (fd); 


shm/incr. dev zero.c 





12-15 SVR4 /dev/zero 内 存 映 射 
6—11 ”自动 变量 zero 以 及 指定 待 创建 路 径 名 的 命令 行 参数 都 被 去 掉 
ce 
12~15 open 文件 /dev/zero 后 把 得 到 的 描述 符 用 于 mmap 调 用 中 。 这 
样 的 映射 保证 内 存 映 射 区 被 初始 化 为 0。 





12.6 17; |: BRS ENSIS 


内 存 映射 一 个 普通 文件 时 ， 内 存 中 映射 区 的 大 小 “mmap 的 第 二 个 
BRD 通 肖 等 于 该 文件 的 大 小 。 例 如 图 12-12 中 ， 文 件 大 小 由 write 设 置 
成 我 们 的 shared 结 构 的 大 小 ， 它 同时 也 是 内 存 映射 区 的 大 小 。 然 而 文件 
大 小 和 内 存 映 射 区 大 小 可 以 不 同 。 

我 们 将 使 用 图 12-16 给 出 的 程序 更 为 细致 地 探讨 mmap 函 数 。 

命令 行 参数 

8 一 11 命令 行 参数 有 三 个 ， 分 别 指定 即将 创建 并 映射 到 内 存 的 文件 
的 路 径 名 、 该 文件 将 被 设置 成 的 大 小 以 及 内 存 上 映射 区 的 大 小 。 

创建 、 打 开 并 截 短文 件 ， 设置 文 件 大 小 

12~15 ” 待 打 开 的 文件 大 不 存在 则 创建 之 ， 寿 已 存在 则 把 它 的 大 小 
截 短 成 0。 接 着 把 该 文件 的 大 小 设置 成 由 命令 行 参 数 指定 的 大 小 ， 办 法 


古 把 文件 读 写 指针 移动 到 这 个 大 小 减 去 1 的 字 节 位 置 ， 然 后 写 1 个 字 节 。 

内 存 映 射 文件 

16—17 ”使 用 作为 最 后 一 个 命令 行 参数 指定 的 大 小 对 该 文件 进行 内 
存 映 射 。 其 描述 符 随 后 被 关闭 。 

输出 页 面 大 小 

18 一 19 使 用 sysconf 获 取 系 统 实现 的 页 面 大 小 并 将 其 输出 。 

读 出 和 存 入 内 存 映射 区 

20—26 ” 读 出 内 存 映 射 区 中 每 个 页 面 的 首 字 节 和 尾 字 节 ， 并 输出 它 
们 的 值 。 我 们 预期 这 些 值 全 为 0。 同 时 把 每 个 页 面 的 这 两 个 字 节 设置 为 
1。 我 们 预期 某 个 引用 会 最 终 引 发 一 个 信号 ， 它 将 终止 程序 。 当 for 循 环 
结束 时 ， 我 们 输出 下 一 页 的 首 字 市 ， 并 预期 这 会 失败 假设 

此 前 程序 还 没有 失败 ) 。 














1 #include "unpipc.h" 

2 unt 

3 main(int argc, char **argv) 

x 4 

5 int fd; 1i 

6 char *ptr; 

7, size t filesize, mmapsize, pagesize; 

8 if (argc != 4) 

9 err quit("usage: testl «pathname» <filesize> <mmapsize>") ; 
10 filesize - atoi(argv[21); 

11 mmapsize - atoi(argv[3]); 

12 /* open file: create or truncate; set file size */ 

13 fd - Open(argv[1], O RDWR | O CREAT | O TRUNC, FILE MODE); 

14 Lseek(fd, filesize-1, SEEK SET); 

15 Write(fd, "", 1); 

16 ptr - Mmap(NULL, mmapsize, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
143 Close(fd); 

18 pagesize - Sysconf( SC PAGESIZE); 

19 printf("PAGESIZE = %ld\n", (long) pagesize); 

20 for (i = 0; i « max(filesize, mmapsize); i += pagesize) { 

21 printf("ptr[$d] = $dWMn", i, ptr[íil); 

22 per[r] s 25 

23 printf("ptr[$d] = $dWMn", i + pagesize - 1, ptr[i + pagesize - 11); 
24 ptr[i + pagesize - 1] = 1; 

25 ) 

26 printf("ptr[$d] = d\n", i, ptr[il); 

27 exit (0) ; 

28 } 





图 12-16 访问 其 大 小 可 能 不 同 于 文件 大 小 的 内 存 映 射 区 


shm/testl.c 


shm/testl.c 


我 们 要 展示 的 第 一 种 情形 的 前 提 是 : 文件 大 小 等 于 内 存 映 射 区 大 
但 这 个 大 小 不 是 页 面 大 小 的 倍数 。 


solaris 96 ls -l foo 


foo: No such file or directory 
solaris 96 test1 foo 5000 5000 
PAGESIZE - 4096 

ptr[0] = 0 

ptr[4095] = 0 

ptr[4096] = 0 

ptr[8191] = 0 


Segmentation Fault(coredump) 

solaris % ls -l foo 

-rw-r--r-- 1 rstevens other1 5000 Mar 20 17:18 foo solaris 96 
od -b -A d foo 

0000000 001 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

0000016 000 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

* 

0004080 000 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 001 

0004096 001 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

0004112 000 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

* 

0005000 

页 面 大 小 为 4096 字 节 ， 我 们 能 够 读 完 整 的 第 2 页 〈 下 标 为 4096 一 
8191) ， 但 是 访问 第 3 页 时 《下 标 为 8192) 引发 SIGSEGV 信 号 ，shell 将 
‘efi tt Segmentation Faut (MRA) ”。 尽 管 我 们 把 ptr[8191] 设 置 
成 1， 它 也 不 写 到 foo 文 件 中 ， 因 而 该 文件 的 大 小 仍然 是 5000。 内 核 允许 
我 们 读 写 最 后 一 页 中 映射 区 以 远 部 分 《内核 的 内 存 保护 是 以 页 面 为 单位 
的 ) 。 但 是 我 们 写 同 这 部 分 扩展 区 的 任何 内 容 都 不 会 写 到 foo 文 件 中 。 
设置 成 1 的 其 他 3 个 字 节 《下 标 分 别 为 0(、4905 和 4906) 复制 回 foo 文 件 ， 
这 一 点 可 使 用 od 命 令 来 验证 。 〈-b 选 项 指定 以 八进制 数 输出 各 个 字 节 ，- 
A d 选 项 指定 以 十 进 制 数 输出 地 址 。) 图 12-17 展 示 了 这 个 例子 。 











MAEN 


偏 移 : 0 4999 


Fix: 0 4999 5000 8191 


Ti ta ERE 71 
nh EF [sc 最 后 一 页 | 
_ 利 余部 分 _ 


访问 引发 
— — — 访问 不 出 问题 一 一 一 -全 SIGSEGV 
i m I 


ay 
mmap () 大 小 
图 12-17 mmap 大 小 等 于 文件 大 小 时 的 内 存 映射 

在 Digital Unix 下 运行 同样 的 例子 ， 得 到 的 结果 类 似 ， 不 过 页 面 大 小 
现在 是 8192 字 节 。 

alpha % Is -l foo 

foo not found 

alpha % test1 foo 5000 5000 

PAGESIZE = 8192 

ptr[0] = 0 

ptr[8191] = 0 

Memory fault(coredump) 

alpha 96 Is -l foo 

-rW-r--r-- 1 rstevens operator 5000 Mar 21 08:40 foo 

我 们 仍然 能 访问 内 存 映 射 区 以 远 部 分 ， 不 过 只 能 在 边界 所 在 的 那个 
内 存 页 面 内 〈 下 标 为 5000 一 8191) 。 访 问 ptr[8192] 将 引发 SIGSEGV 信 





号 ， 这 是 我 们 预期 的 。 

在 执行 图 12-16 所 示 程 序 的 下 一 个 例子 中 ， 我 们 把 内 存 映射 区 大 小 

《15000 字 节 ) 指定 成 大 于 文件 大 小 “5000 字 市 )。 

solaris % rm foo 

solaris % test1 foo 5000 15000 

PAGESIZE = 4096 

ptr[0] = 0 

ptr[4095] = 0 

ptr[4096] 7 0 

ptr[8191] = 0 

Bus Error(coredump) 

solaris 96 Is -] foo 

-rw-r--r-- 1 rstevens other1 5000 Mar 20 17:37 foo 

HER FC BU IAS SCPE AAD SEF AER XA GbE 5000715 P 
的 例子 类 似 。 本 例子 引发 SIGBUS 信 号 〈 其 shell 输 出 为 "Bus Error (总 线 
出 错 ) ”) ， 前 一 个 例子 则 引发 SIGSEGV 信 号。 两 者 的 差别 是 ， 
SIGBUS 意 味 着 我 们 是 在 内 存 映射 区 内 访问 ,但 是 已 超出 了 底层 文 撑 对 
象 的 大 小 。 上 一 个 例子 中 的 SIGSEGV 则 意味 着 我 们 已 在 内 存 映射 区 以 
远 访 问 。 可 以 看 出 ， 内 核 知道 被 映射 的 底层 文 撑 对 象 〈 本 例子 中 为 文件 
foo) 的 大 小 ， 即 使 该 对 象 的 描述 符 已 经 关闭 也 一 样 。 内 核 允 许 我 们 给 
mmap 指 定 一 个 大 于 该 对 象 大 小 的 大 小 参数 ， 但 是 我 们 访问 不 了 该 对 象 
以 远 的 部 分 (最 后 一 页 上 该 对 象 以 远 的 那些 字 节 除外 ， 它 们 的 下 标 为 
5000~8191) 。 图 12-18 展 示 了 这 个 例子 。 





文件 大 小 


偏 移 : 0 4999 mmap () 大 小 


下 标 :_0 4999 5000 ”8191 8192 "M. 
所 有 页 
剩余 部 分 T 
— 访问 引发 


一 一 一 一 iiit —————>}——-_ stGBUs 一 一 一 | SIGSEGV 


信号 
图 12-18 mmap 大 小 超过 文件 大 小 时 的 内 存 映射 
图 12-19 给 出 了 我 们 的 下 一 个 程序 。 它 展示 了 处 理 一 个 持续 增长 的 
文件 的 一 种 常用 技巧 ， 指 定 一 个 大 于 该 文件 大 小 的 内 存 映射 区 大 小 ， 跟 
踪 该 文件 的 当前 大 小 (以 确保 不 访问 当前 文件 尾 以 远 的 部 分 ) ， 然 后 就 
让 该 文件 的 大 小 随 着 往 其 中 每 次 写 入 数据 而 增长 。 


shm/test2.c 





1 #include "unpipc.h" 


2 #define FILE "test.data" 
3 #define SIZE 32768 


4 int 

5 main(int argc, char **argv) 

e { 

7 int fd, i; 

8 char *ptr; 

9 /* open: create or truncate; then mmap file */ 

10 fd - Open(FILE, O RDWR | O CREAT | O TRUNC, FILE MODE); 
11 ptr = Mmap (NULL, SIZE, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
12 for (i = 4096; i <= SIZE; i += 4096) { 

13 printf ("setting file size to %d\n", i); 
14 Ftruncate (fd, i); 

15 printf ("ptr[%d] = d\n", i-1, ptr[i-1]); 

16 } 

17 exit (0); 

18 ) 





shm/test2.c 


图 12-19 允许 文件 大 小 增长 的 内 存 映 射 区 例子 


JIAE E 
9—11 打开 一 个 文件 ， 夺 不 存在 则 创建 之 ， 奋 已 存在 则 把 它 截 短 成 


大 小 为 0。 以 32768 字 节 的 

大 小 对 该 文件 进行 内 存 上 映射， 尽管 它 当 前 的 大 小 为 0。 

增长 文件 大 小 

12~16 通过 调用 ftruncate〈13.3 节 ) 把 该 文件 的 大 小 每 次 增长 4096 
字 节 ， 然 后 取出 现在 是 该 文件 最 后 一 个 字 节 的 那个 字 市 。 

现在 运行 这 个 程序 ， 我 们 看 到 随 着 文件 大 小 的 增长 ， 我 们 能 通过 所 
建立 的 内 存 映 射 区 访问 新 的 数据 。 

alpha % Is -l test.data 





test.data: No such file or directory 
alpha % test2 

setting file size to 4096 
ptr[4095] = 0 

setting file size to 8192 
ptr[8191] = 0 

setting file size to 12288 
ptr[12287] = 0 

setting file size to 16384 
ptr[16383] = 0 

setting file size to 20480 
ptr[20479] = 0 

setting file size to 24576 
ptr[24575] = 0 

setting file size to 28672 
ptr[28671] = 0 

setting file size to 32768 
ptr[32767] = 0 

alpha 96 lIs -l test.data 


-rw-r--r-- 1 rstevens other1 32768 Mar 20 17:53 test.data 

ANPP AEH, AZERE a ANRI ER ES SCION] R RATP 
文件 test.data) 的 大 小 ， 而 且 我 们 总 是 能 访问 在 当前 文件 大 小 以 内 又 在 
内 存 映 射 区 以 内 的 那些 字 节 。 在 Sloaris 2.6 下 我 们 取得 了 同样 的 结果 。 

本 节 处 理 的 是 内 存 映射 文件 和 mmap。 习 题 13.1 中 我 们 要 求 把 这 两 
个 程序 改 为 处 理 Posix 共 享 内 存 区 ， 将 看 到 相同 的 结果 。 


12.7 425 


共享 内 存 区 是 可 用 IPC 形 式 中 最 快 的 ， 因 为 共享 内 存 区 中 的 单个 数 
据 副 本 对 于 共享 该 内 存 区 的 所 有 线程 或 进程 都 是 可 用 的 。 然 而 为 协调 共 
享 该 内 存 区 的 各 个 线程 或 进程 ， 通 常 需要 某 种 形式 的 同步 。 

本 章 集 中 于 mmap 函 数 以 及 普通 文件 的 内 存 映射 ， 因 为 这 是 有 亲缘 
关系 的 进程 间 共 享 内 存 空间 的 一 种 方法 。 一 旦 内 存 映 射 了 一 个 文件 ， 我 
们 就 不 再 使 用 read、write 和 lseek 来 访问 该 文件 ， 而 只 是 存 取 已 由 mmap 
映射 到 该 文件 的 内 存 位 置 。 把 显 式 的 文件 VO 操作 变换 成 存 取 内 存单 元 
往往 能 够 简化 我 们 的 程序 ， 有 时 候 还 能 改善 性 能 。 

如 末 设 置 共 享 内 存 区 的 目的 是 为 了 穿越 某 个 后 续 的 fork 在 父子 进程 
间 共 享 它 ， 那 么 通过 使 用 匿名 内 存 映 射 可 简化 其 步 又， 这 样 就 不 需要 创 
建 一 个 竺 映射 的 普通 文件 。 这 里 或 者 涉及 MAP_ANON 这 个 新 标志 〈 适 
用 于 源 自 Berkeley 的 内 核 ) ， 或 者 涉及 /dev/zero 设 备 文 件 的 映射 (适用 
于 源 自 SVR4 的 内 核 ) 。 

我 们 如 此 详尽 地 讨论 mmap 的 理由 有 两 个 : 一 是 文件 的 内 存 映射 是 
一 种 很 有 用 的 技巧 ， 二 是 Posix 共 享 内 存 区 也 使 用 mmap， 它 是 下 一 章 的 
主题 。 

Posix 还 定义 了 “我 们 没有 讨论 过 的 ) 处 理 内 存 管 理 的 4 个 额外 函 
数 。 























mlockall 会 使 调用 进程 的 整个 内 存 空间 和 常 驻 内 存 。munlockall 则 撤销 
这 种 锁定 。 

mlock 会 使 调用 进程 地 址 空间 的 某 个 指定 范围 钊 驻 内 存 ， 该 函数 的 
参数 指定 了 这 个 范围 的 起 始 地 址 以 及 从 该 地 址 算 起 的 字 节 数 。munlock 
则 撤销 某 个 指定 内 存 区 的 锁定 。 


习题 


12.1 在 图 12-19 中 ， 如 果 多 执行 一 次 for 循 环 内 的 那 段 代码 ， 那 么 会 
发 生 什 么 ? 

12.2 假设 有 两 个 进程 ， 一 个 是 发 送 者 ， 一 个 是 接收 者 ， 前 者 只 是 向 
后 者 发 送 消息 。 再 假设 它们 采用 System V 消 息 队 列 发 送 消息 ， 请 画 出 消 
息 从 发 送 者 去 往 接 收 者 的 示意 图 。 现 在 假设 这 两 个 进程 采用 我 们 在 5.8 
节 提 供 的 Posix 消 息 队 列 的 实现 来 发 送 消 息 ， 请 画 出 新 的 消息 传递 示意 
图 。 

12.3 在 讨论 mmap 的 MAP_SHARED 标 志 时 ， 我 们 说 过 内 核 虚拟 内 存 
算法 将 把 对 内 存 映像 的 任何 变动 更 新 到 实际 的 文件 中 。 查 看 /dev/zero 的 
手册 页 面 ， 判 定 在 内 核 把 对 内 存 映像 的 变动 写 回 该 文件 时 ， 发 生 了 什 
4 

12.4 把 图 12-10 改 为 指定 MAP_PRIVATE 标 志 而 不 是 MAP_SHARED 
标志 ， 并 验证 其 结果 与 图 12-3 的 类 似 。 被 映射 到 内 存 的 文件 的 内 容 是 什 

2 





12.5 在 6.9 节 中 我 们 提 到 过 ， 对 System V 消 息 队 列 select 读 写 条件 的 
方法 之 一 是 : 创建 一 个 匿名 共享 内 存 区 ， 派 生 一 个 子 进程 ， 让 该 子 进程 
阻塞 在 msgrcv 调 用 中 ， 以 将 消息 读 入 到 该 匿名 共享 内 存 区 中 。 父 进程 还 
创建 两 个 管道 ， 其 中 一 个 管道 由 子 进程 用 来 向 父 进程 通知 已 在 共享 内 存 
区 中 准备 好 一 个 消息 ， 男 一 个 管道 则 由 父 进 程 用 来 向 子 进程 通知 共享 内 











存 区 已 可 用 。 这 就 允许 父 进程 对 前 一 个 管道 的 读 出 端 select 可 读 条 件 ， 
同时 对 它 想 要 选择 的 其 他 描述 符 select 读 写 条 件 。 请 把 上 述 办 法 编写 成 
代码 。 其 中 匿名 共享 内 存 对 象 的 分 配 调用 我 们 的 my_shm 函 数 〈 图 A- 
46) 完成 。 创 建 消 息 队 列 使 用 我 们 在 6.6 节 提供 的 msgcreate 和 msgsnd 程 
序 ， 然 后 把 记录 放 到 该 队列 中 。 父 进程 应 该 只 输出 由 子 进程 读 入 的 每 个 
消息 的 大 小 和 类 型 。 





第 13 瘟 Posi = WN A X 


上 一 章 较 为 笼统 地 讨论 了 共享 内 存 区 以 及 mmap 函 数 ， 并 给 出 了 使 
用 mmap 提 供 父 子 进程 间 的 共享 内 存 区 的 例子 : 

使 用 内 存 映 射 文件 〈 图 12-10) ; 

使 用 4.4BSD 匿 名 内 存 映 射 《 图 12-14) ; 

使 用 /dewzero 匿 名 内 存 映 射 〈 图 12-15) 。 

我 们 现在 把 共享 内 存 区 的 概念 扩展 到 将 无 亲缘 关系 进程 间 共 享 的 内 
存 区 包括 在 内 。Posix.1 提 供 了 两 种 在 无 杀 缘 关系 进程 间 共 享 内 存 区 的 方 
Ts 

(1) 内 存 映射 文件 (memory-mapped file) : 由 open 函 数 打 开 ， 由 
mmap 函 数 把 得 到 的 描述 符 上 映射 到 当前 进程 地 址 空间 中 的 一 个 文件 。 我 
们 在 第 12 章 中 讲述 了 这 种 技术 ， 并 给 出 了 它 在 父子 进程 间 共享 内 存 区 时 
的 用 法 。 内 存 映射 文件 也 可 以 在 无 亲缘 关系 的 进程 间 共 享 。 

(2) 共 享 内 存 区 对 象 (shared-memory object) : 由 shm_open 打 开 一 
个 Posix.1 IPC 名 字 “也许 是 在 文件 系统 中 的 一 个 路 径 名 ) ， 所 返回 的 摘 
述 符 由 mmap 函 数 映 射 到 当前 进程 的 地 址 空间 。 我 们 将 在 本 章 讲 述 这 种 
技术 。 

这 两 种 技术 都 需要 调用 mmap， 差 别 在 于 作为 mmap 的 参数 之 一 的 摘 
述 符 的 获取 手段 : 通过 open 或 通过 shm_open。 图 13-1 展 示 了 这 个 差别 。 
Posix 把 两 者 合 称 为 内 存 区 对 象 (memory object) 。 











Posix 内 存 映射 文件 Posix 共 享 内 存 区 对 象 


fd = open(pathname, ... ); fd = shm open(name, ... ); 

Se 

ptr = mmapl . a fd, wes JF ptm = mmap s: $ £a; gas Lj 
Posix 内 存 区 对 象 


图 13-1 Posix 内 存 区 对 象 : 内 存 映 射 文件 和 共享 内 存 区 对 象 


13.2 shm_open#llshm_unlinkpé žy 


Posix 共 享 内 存 区 涉及 以 下 两 个 步 又 要 求 。 

(指定 一 个 名 字 参 数 调用 shm_open， 以 创建 一 个 新 的 共享 内 存 区 
对 象 或 打开 一 个 已 存在 的 共享 内 存 区 对 象 。 

(2) 调 用 mmap 把 这 个 共享 内 存 区 映射 到 调用 进程 的 地 址 空间 。 

传递 给 shm_open 的 名 字 参 数 随后 由 希望 共享 该 内 存 区 的 任何 其 他 进 
程 使 用 。 

Posix 共 享 内 存 区 采用 这 样 的 两 步 过 程 ， 而 不 是 只 用 单个 步 又， 即 
取得 一 个 名 字 后 直接 返回 调用 进程 内 存 空 间 中 的 某 个 地 址 ， 其 原因 在 于 
当 Posix 发 明 自己 的 共享 内 存 区 形式 时 ，mmap 已 经 存在 。 显 然 ， 单 个 函 
数 完全 可 以 做 那 两 步 工作 。shm_open 返 回 一 个 描述 符 〈 回 想 一 下 ， 
mdq_open 返 回 一 个 mqd_t 值 ，sem_open 返 回 一 个 指向 某 个 sem_t 值 的 指 
针 ) 的 原因 是 : mmap 用 于 把 一 个 内 存 区 对 象 映 射 到 调用 进程 地 址 空间 
的 是 该 对 象 的 一 个 已 打开 描述 符 。 


#include <sys/mman.h> 

















int shm_open(const char *name, int oflag,mode t mode); 
int shm_unlink(const char *name); 
返回 : ATW ASE Aa, Ah EA- 
返回 : ARIU, A hA- 


我 们 已 在 2.2 节 描述 过 有 关 name 参 数 的 规则 。 

oflag 人 参数 必须 或 者 含有 O_RDONLY (只 读 ) 标志 ， 或 者 含有 
O_RDWR (5) 标志 ， 还 可 以 指定 如 下 标志 : O CREAT. O EXCL 
或 O TRUNC。O_CREAT 和 O_EXCL 标 志 已 在 2.3 节 描述 过 。 如 果 随 
O_RDWR 指定 O_TRUNC 标 志 ， 而 且 所 需 的 共享 内 存 区 对 象 已 经 存在 ， 
那么 它 将 被 截 短 成 0 长 度 。 

mode 参 数 指定 权限 位 〈 图 2-4) ， 它 在 指定 了 O_CREAT 标 志 的 前 提 
下 使 有 用。 注意， 与 ndq_open 和 sem_open 函 数 不 同 ，shm_open 的 mode 人 参数 
总 是 必须 指定 。 如 果 没 有 指定 O_CREAT 标 志 ， 那 么 该 参数 可 以 指定 为 
0。 

shm_open 的 返回 值 是 一 个 整数 描述 符 ， 它 随后 用 作 mmap 的 第 五 个 
参数 。 

shm_unlink 函 数 删 除 一 个 共享 内 存 区 对 象 的 名 字 。 跟 所 有 其 他 
unlink 函 数 《〈 删 除 文件 系统 中 一 个 路 径 名 的 unlink， 删 除 一 个 Posix 消 息 
队列 的 mq_unlink， 以 及 删除 一 个 Posix 有 名 信号 量 的 sem_unlink) 一 
样 ， 删 除 一 个 名 字 不 会 影响 对 于 其 底层 文 撑 对 象 的 现 有 引用 ， 直 到 对 于 
该 对 象 的 引用 全 部 关闭 为 止 。 删 除 一 个 名 字 仅 仅 防 止 后 续 的 open、 
mq_open 或 sem_open 调 用 取得 成 功 。 


13.3 ftruncate fll fstat pk Zi 


处 理 mmap 的 时 候 ， 普 通 文件 或 共享 内 存 区 对 象 的 大 小 都 可 以 通过 
调用 ftruncate 修 改 。 


#include <unistd.h> 











int ftruncate(int fd,off_t length); 
返回 : ARIUN, FBA- 
Posix 就 该 函数 对 普通 文件 和 共享 内 存 区 对 象 的 处 理 的 定义 稍 有 不 


同 。 

对 于 一 个 普通 文件 : 如 果 该 文件 的 大 小 大 于 length 参 数 ， 额 外 的 数 
据 就 被 丢弃 掉 。 如 果 该 文件 的 大 小 小 于 lengh， 那 么 该 文件 是 否 修改 以 
及 其 大 小 是 否 增长 是 未 加 说 明 的 。 实 际 上 对 于 一 个 普通 文件 ， 把 它 的 大 
小 扩展 到 length 字 节 的 可 移植 方法 是 : 先 lseek 到 偏 移 为 length-1 处 ， 然 后 
write 1 个 字 节 的 数据 。 所 幸 的 是 几乎 所 有 Unix 实 现 都 文 持 使 用 ftruncate 
扩展 一 个 文件 。 

对 于 一 个 共享 内 存 区 对 象 : ftruncate 把 该 对 象 的 大 小 设置 成 length 字 








aT a 

我 们 调用 ftruncate 来 指定 新 创建 的 共享 内 存 区 对 象 的 大 小 ， 或 者 修 
改 已 存在 的 对 象 的 大 小 。 当 打开 一 个 已 存在 的 共享 内 存 区 对 象 时 ， 我 们 
可 调用 fstat 来 获取 有 关 该 对 象 的 信息 。 

#include <sys/types.h> 











#include <sys/stat.h> 
int fstat(int fd,struct stat *buf); 
返回 : A MAO, ABENA- 
stat 结 构 有 12 个 或 以 上 的 成 员 CAPUE 第 4 章 详细 讨论 它 的 所 有 成 
， 然 而 当 fd 指 代 一 个 共享 内 存 区 对 象 时 ， 只 有 四 个 成 员 含 有 信息 。 


struct stat { 





xu 
NA 


mode t st mode; /* mode: S_I{RW}{USR,GRP,OTH} */ 


uid t st uid; /* user ID of owner */ 
gid t st gid; /* group ID of owner */ 
off t st size; /* size in bytes */ 

h 


我 们 将 在 下 一 节 给 出 使 用 这 两 个 函数 的 例子 。 


不 幸 的 是 ，Posix.1 并 没有 指定 一 个 新 创建 的 共享 内 存 区 对 象 的 初始 
内 容 。 关 于 shm_open 函 数 的 说 明 只 说 : “新 创建 的 ) 共享 内 存 区 对 象 
的 大 小 应 该 为 0*。 关 于 ftruncate 冰 数 的 说 明 指 定 ， 对 于 一 个 普通 文件 
(不 是 共享 内 存 区 〉) ，“ 如 果 其 大 小 被 扩展 ， 那 么 扩展 部 分 应 显得 好 像 
已 用 0 填写 过 ”。 然 而 同样 在 关于 ftruncate 的 说 明 中 ， 却 没有 任何 有 关 被 
扩展 了 的 一 个 共享 内 存 区 对 象 新 内 容 的 陈述 。Posix.1 基 本 原理 声 
称 : “如 果 一 个 内 存 区 对 象 被 扩展 ， 那 么 扩展 部 分 内 容 全 为 0。” 然 而 这 
只 是 基本 原理 ， 而 不 是 正式 标准 。 当 作者 在 comp.std.unix 新 闻 组 上 就 此 
细节 提出 疑问 时 ， 得 到 的 观点 是 有 些 广 家 反对 初始 化 为 0 的 要 求 ， 因 为 
这 么 做 的 开销 很 大 。 如 果 一 个 新 扩展 的 共享 内 存 区 未 被 初始 化 为 某 个 值 
《也 就 是 说 其 内 容 在 扩展 前 后 没有 改动 ) ， 那 么 有 可 能 成 为 一 个 安全 漏 
洞 。 





13.4 简单 的 程 


现在 开发 一 些 简单 的 程序 来 操作 Posix 共 享 内 存 区 。 

13.4.1 shmcreate 程 序 

图 13-2 给 出 的 shmcreate 程 序 以 某 个 指定 的 名 字 和 长 度 创建 一 个 共享 
内 存 区 对 象 。 


pxshm/shmcreate.c 





1 #include "unpipc.h" 


2 dnt 

3 main(int argc, char **argv) 
4{ 

int c, fd, flags; 
char *ptr; 

off t length; 


œ yo 


flags = O_RDWR | O CREAT; 





图 13-2 创建 一 个 具有 所 指定 大 小 的 Posix 共 享 内 存 区 对 象 











9 while ( (c = Getopt(argc, argv, "e")) != -1) { 


10 switch (c) { 

11 case te" 

12 flags |= O EXCL; 

13 break; 

14 } 

15 } 

16 if (optind != argc - 2) 

17 err quit("usage: shmcreate [ -e ] «name» <length>") ; 
18 length = atoi(argv[optind + 1]); 

19 fd - Shm open(argv[optind], flags, FILE MODE); 

20 Ftruncate(fd, length); 

ls ptr = Mmap (NULL, length, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
22 exit (0) ; 

23 } 


pxshm/shmcreate.c 





图 13-2 (Hb 


19—22 shm_create 创 建 押 指定 的 共 胖 内 存 区 对 象 。 如 有 果 指 定 了 -e 选 

， 那 么 知 该 对 象 已 经 存在 则 将 出 错 。ftruncate 设 置 该 对 象 的 长 度 ， 
a E LET BI Yad FP HEFE A ES ME] o 

本 程序 随后 终止 。 既 然 Posix 共 享 内 存 区 至 少 具 有 随 内 核 的 持续 
性 ， 因 此 本 程序 的 终止 不 会 删除 该 共享 内 存 区 对 象 。 

13.4.2 shmunlink 程 序 

图 13-3 给 出 的 简单 程序 只 是 调用 shm_unlink 从 系统 中 删除 一 个 共享 
内 存 区 对 象 的 名 字 。 





pxshm/shmunlink.c 





1 #include "unpipc.h" 
2 int 

3 main(int argc, char **argv) 

a { 

5 VE (Arga Js 2) 

6 err _ quit ("usage: shmunlink <name>") ; 
7 Shm_unlink (argv [1] ) ; 

8 exit (0) ; 


pxshm/shmunlink.c 





图 13-3 删除 一 个 共享 内 存 区 对 象 的 名 字 


13.4.3 shmwrite 程 序 
图 13-4 给 出 了 shmwrite 程 序 ， 它 往 一 个 共享 内 存 区 对 象 中 写 入 一 个 





模式 : 0， 15 25 2 254, 255, 0, 1, ME 


10—15 ”shmopen 打 开 所 指定 的 共享 内 存 区 对 象 ，fstat 获 取 其 大 小 信 








>> m 十 S Avy 
息 。 使 用 mmap 映 射 它 之 后 close 它 的 描述 符 。 
-十 x rasa M T 
16—18 把 模式 写 入 该 共享 内 存 区 。 
pxshm/shmwrite.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 { 
5 int i; fd; 
6 struct stat stat; 
7 unsigned char *ptr; 
8 if (argc !- 2) 
9 err quit("usage: shmwrite <name>") ; 
10 /* open, get size, map */ 
TL fd = Shm open(argv[1], O_RDWR, FILE MODE); 
12 Fstat(fd, &stat); 
13 ptr - Mmap(NULL, stat.st size, PROT READ | PROT WRITE, 
14 MAP SHARED, fd, 0); 
15 Close (fd); 
16 /* set: ptr[0] = 0, ptr[1] = 1, etc. */ 
14. for (i = 0; i < stat.st size; i++) 
18 *ptr++ = i % 256; 
19 exit (0); 
20 } 
pxshm/shmwrite.c 
113-4 打开 一 个 共享 内 存 区 对 象 ， 填 写 一 个 数据 模式 
ri 
13.4.4 shmread 程 序 


图 13-5 给 出 的 shmread 程 序 验 证 由 shmwrite 写 入 的 模式 。 





pxshm/shmread.c 
1 #include "unpipc.h" 


2 ant 

3 main(int argc, char **argv) 
4 { 

5 int 1, Ed: 
6 struct stat stat; 
7 
8 
9 


unsigned char c, *ptr; 


if (arge l= 2) 
err quit("usage: shmread <name>") ; 


10 /* open, get size, map */ 

11 fd = Shm_open(argv[1], O_RDONLY, FILE_MODE) ; 
工 2 Fstat (fd, &stat); 

13 ptr = Mmap(NULL, stat.st_size, PROT_READ, 

14 MAP SHARED, fd, 0); 

15 Close (fd) ; 

16 /* check that ptr[0] = 0, ptr[1] = 1, etc. */ 
17 for (i = 0; i < stat.st size; i++) 

18 if ( (c = *ptr++) I= (i % 256)) 

19 err ret ("ptr[%d] = $d", i, c); 

20 exit (0); 

21 } 


pxshm/shmread.c 








图 13-5 打开 一 个 共享 内 存 区 对 象 ， 验 证 其 数据 模式 


10—15 打开 所 指定 的 共享 内 存 区 对 象 用 于 只 读 ， 使 用 fstat 获 取 其 大 
小 信息 ， 使 用 mmap 把 它 映 射 到 内 存 〈 用 于 只 读 目的 ) ， 随 后 关闭 其 描 
述 符 。 

16~ 19 验证 由 shmwrite 写 入 的 模式 。 

13.4.5 例子 

在 Digital ^ Unix ”4.0B 下 创建 一 个 长 度 为 123 ”456 字 节 、 名 
为 /tmp/myshm 的 共享 内 存 区 对 象 。 

alpha % shmcreate /tmp/myshm 123456 





alpha 96 ls -l /tmp/myshm 

-rw-r--r--  lrstevens system 123456 Dec 10 14:33 /tmp/myshm 
alpha 96 od -c /tmp/myshm 

0000000 \0 NO X0 \0 NO NO NO NO NO \0 NO NO NO NO NO SO 


米 


0361100 
我 们 看 到 在 文件 系统 中 创建 了 一 个 同名 文件 。 使 用 od 程序 可 验证 该 
对 象 的 初始 内 容 为 0。《 刚 刚 超 过 该 文件 最 后 一 个 字 节 位 置 的 八进制 字 
节 偏 移 0361100， 等 于 十 进 制 的 123 456. ) 
接着 运行 我 们 的 shmwrite 程 序 ， 然 后 使 用 od 验 证 初始 内 容 与 预期 的 
一 致 。 


alpha % shmwrite /tmp/myshm 





alpha % od -x /tmp/myshm | head -4 

0000000 0100 0302 0504 0706 0908 0b0a 0d0c Of0e 

0000020 1110 1312 1514 1716 1918 1b1a 1d1c 1f1e 

0000040 2120 2322 2524 2726 2928 2b2a 2d2c 2f2e 

0000060 3130 3332 3534 3736 3938 3b3a 3d3c 3f3e 

alpha % shmread /tmp/myshm 

alpha 96 shmunlink /tmp/myshm 

我 们 使 用 shmread 验 证 该 共 胖 内 存 区 对 象 的 内 容 后 删除 其 名 字 。 

如 果 在 Solaris 2.6 下 运行 我 们 的 shmcreate 程 序 ， 我 们 看 到 在 /tmp 目 录 
下 创建 了 一 个 具有 所 指定 大 小 的 文件 。 


solaris % shmcreate —e /testshm 123 





solaris 96 Is -1/tmp /.*testshm* 

-rW-r—r-- 1 rstevens other1 123 Dec 10 14:40 /tmp/.SHMtestshm 

13.4.6 例子 

我 们 现在 在 图 13-6 中 提供 一 个 简单 的 例子 程序 ， 以 展示 同一 共 至 内 
存 区 对 象 内 存 映射 到 不 同 进程 的 地 址 空间 时 ， 起 始 地 址 可 以 不 一 样 。 

10—14 ”创建 一 个 其 名 字 为 命令 行 参 数 的 共享 内 存 区 ， 把 它 的 大 小 
设置 为 一 个 整数 的 大 小 ， 然 后 打开 文件 /etc/motd。 

15—30 fork 后 父子 进程 都 调用 mmap 两 次 ， 但 顺序 不 一 样 。 父 子 进 
程 分 别 输出 每 个 内 存 映 射 区 的 起 始 地 址 。 子 进程 接着 睡眠 5 秒 ， 父 进程 


则 在 共享 内 存 区 中 写 入 值 777， 子 进程 醒 来 后 输出 该 值 。 
运行 这 个 程序 ， 我 们 发 现 所 指定 的 共享 内 存 区 对 象 在 父子 进程 中 被 
内 存 映射 到 不 同 的 起 始 地 址 。 


solaris % test3 test3.data 





parent: shm ptr = eee30000,motd ptr = eee20000 

child: shm ptr = eee20000,motd ptr = eee30000 

shared memory integer = 777 

父 进 程 把 值 777 存 入 0xeee30000 位 置 ， 子 进程 却 从 0xeee20000 位 置 读 
出 该 值 。 父 子 进程 中 指针 ptr1 都 指向 同一 共 至 内 存 区 ， 即 使 每 个 指针 在 
各 自 进程 内 有 不 同 的 值 也 不 受 影 响 。 





pxshm/test3.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fdl, fd2, *ptrl, *ptr2; 

6 pid t childpid; 

7 struct stat stat; 

8 if (argc !- 2) 

9 err quit("usage: test3 <name>") ; 

10 shm unlink (Px_ipc_name(argv[1])); 

11 fdi = Shm open(Px ipc name(argv[1]), O_RDWR | O CREAT | O EXCL, FILE MODE); 
12 Ftruncate(fdl, sizeof(int)); 

13 fd2 - Open("/etc/motd", O RDONLY); 

14 Fstat(fd2, &stat); 

15 if ( (childpid = Fork()) -- 0) { 

16 /* child */ 

17 ptr2 = Mmap(NULL, stat.st size, PROT READ, MAP SHARED, fd2, 0); 
18 ptrl - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, 
19 MAP SHARED, fdl, 0); 
20 printf("child: shm ptr = $p, motd ptr = $pWMn", ptrl, ptr2); 
21 sleep (5); 
22 printf ("shared memory integer = %d\n", *ptrl); 
23 exit (0) ; 
24 } 
25 /* parent: mmap in reverse order from child */ 
26 ptrl = Mmap (NULL, sizeof (int), PROT READ | PROT WRITE, MAP SHARED, fdl, 0); 
27 ptr2 = Mmap(NULL, stat.st size, PROT READ, MAP SHARED, fd2, 0); 
28 printf("parent: shm ptr = %p, motd ptr = %p\n", ptrl, ptr2); 
29 *ptrl - 777; 
30 Waitpid(childpid, NULL, 0); 
31 exit(0); 
32 ) 


pxshm/test3.c 











图 13-6 共享 内 存 区 在 不 同 进程 中 可 以 出 现在 不 同 的 地 址 





13.5 给 一 个 共享 的 计数 器 持续 加 1 





现在 开发 一 个 类 似 于 12.3 市 中 给 出 的 例子 ， 它 由 多 个 进程 给 存放 在 
共享 内 存 区 中 的 某 个 计数 器 持续 加 1。 我 们 把 该 计数 器 存放 在 一 个 共享 
内 存 区 中 ， 并 用 一 个 有 名 信号 量 来 同步 ， 不 过 不 再 需要 父子 进程 关系 
了 。 既 然 Posix 共 享 内 存 区 对 象 和 Posix 有 名 信号 量 都 是 以 名 字 来 访问 
的 ， 因 此 将 给 共享 的 计数 器 持续 加 1 的 各 个 进程 间 可 以 没有 杀 缘 关系 ， 
不 过 它们 都 得 知道 该 共享 内 存 区 和 该 信号 量 的 IPC 名 字 ， 并 有 访问 这 两 

















个 IPC 对 象 的 足够 权限 。 

图 13-7 给 出 的 服务 器 程序 创建 所 指定 的 共享 内 存 区 对 象 ， 创 建 并 初 
始 化 所 指定 的 信号 量 ， 然 后 终止 。 

创建 共享 内 存 区 对 象 

13~19 我 们 调用 shm_unlink 以 提防 所 需 共 享 内 存 区 对 象 已 经 存在 的 
情况 ， 然 后 调用 shm_open 创 建 该 对 象 。ftruncate 将 该 对 象 的 大 小 设置 成 
我 们 的 shmstruct 结 构 的 大 小 ， 该 对 象 本 映 则 随后 由 mmap 映 射 到 调用 进 
程 的 地 址 空间 。 接 着 关闭 该 对 象 的 描述 符 。 





pxshm/server1.c 





1 #include "unpipc.h" 

2 struct shmstruct ( /* struct stored in shared memory */ 

3 int count; 

4 } 

5 sem t *mutex; /* pointer to named semaphore */ 

6 int 

7 main(int argc, char **argv) 

8 ( 

9 int fd; 

10 struct shmstruct*ptr; 

aM if (argc != 3) 

12 err quit("usage: serverl «shmname» <semname>") ; 

13 shm unlink(Px ipc name (argv[1])); /* OK if this fails */ 

14 /* create shm, set its size, map it, close descriptor */ 

15 fd - Shm open(Px ipc name(argv[1]), O RDWR | O CREAT | O EXCL, FILE MODE); 
16 Ftruncate(fd, sizeof(struct shmstruct)); 

17 ptr - Mmap(NULL, sizeof(struct shmstruct), PROT READ | PROT WRITE, 
18 MAP SHARED, fd, 0); 

19 Close (fd); 

20 sem unlink(Px ipc name (argv [2])); /* OK if this fails */ 

21 mutex - Sem open(Px ipc name(argv[2]), O CREAT | O EXCL, FILE MODE, 1); 
22 Sem close (mutex) ; 

23 exit(0); 

24 } 


pxshm/server l.c 














图 13-7 创建 并 初始 化 共享 内 存 区 和 信和 号 量 的 程序 
创建 并 初始 化 信号 量 
20~22 我 们 调用 sem_unlink 以 提防 所 需 信号 量 已 经 存在 的 情况 ， 然 
后 调用 sem_open 创 建 该 有 名 信号 量 ， 并 把 它 初 始 化 为 1。 将 给 存放 在 所 

















创建 的 共享 内 存 区 对 象 中 的 计数 器 加 1 的 任何 进程 都 会 把 该 信号 量 用 作 
一 个 互 斥 锁 。 接 着 关闭 该 信号 量 。 

终止 

23 进程 终止 。 既 然 Posix 共 享 内 存 区 至 少 具 有 随 内 核 的 持续 性 ， 因 
此 所 创建 的 该 对 象 将 继续 存在 ， 直 到 和 它 的 所 有 打开 着 的 引用 都 关闭 〈 当 
本 进程 终止 时 ， 该 对 象 不 再 有 打开 着 的 引用 ) 并 且 该 对 象 被 显 式 地 删除 
为 止 。 

我 们 的 程序 必须 给 共享 内 存 区 和 信号 量 使 用 不 同 的 名 字 。 操 作 系 统 
并 不 保证 给 IPC 名 字 加 上 点 什么 以 区 分 消息 队列 、 信 和 号 量 和 共享 内 存 
区 。 我 们 已 看 到 Solaris 给 这 三 种 IPC 类 型 的 名 字 分 别 加 上 .MQ、.SEM 
和 .SHM 的 前 级 ， 但 是 Digital Unix 却 没有 这 样 做 。 
图 13-8 给 出 了 我 们 的 客户 程序 ， 它 对 存放 在 共享 内 存 区 中 的 计数 器 

定 次 数 的 加 1 操作 ， 每 次 给 该 计数 器 加 1 时 都 事先 获取 保护 它 的 信 














执行 


qtu 
HD D 


打开 共 EEA XK 

15—18 shm_open 打 开 所 指定 的 共享 内 存 区 对 象 ， 该 对 象 必 须 存 在 
(因为 没有 指定 O_CREAT 标 志 ) 。 x PM 
程 的 地 址 空间 ， 

fas 

DD eee 














1 #include "unpipc.h" 


2 struct shmstruct { 


3 int count; 
4 }; 

5 sem t *mutex; 

6 int 


7 main(int argc, char **argv) 


8 { 


pxshm/clientl.c 


/* struct stored in shared memory */ 


/* pointer to named semaphore */ 


9 int fd, i, nloop; 

10 pid t pid; 

Li struct shmstruct*ptr; 

12 if (arge != 4) 

T3 err quit("usage: client1 <shmname> <semname> <#loops>") ; 
14 nloop = atoi (argv[3]); 

15 fd = Shm_open(Px_ipc_name(argv[1]), O_RDWR, FILE MODE) ; 

16 ptr = Mmap(NULL, sizeof(struct shmstruct), PROT_READ | PROT_WRITE, 
17 MAP SHARED, fd, 0); 

18 Close(fd); 

19 mutex = Sem open(Px ipc name (argv[2]), 

20 pid = getpid(); 

21 for (i = 0; i < nloop; i++) { 

22 Sem_wait (mutex) ; 

23 printf ("pid $1d: d\n", (long) pid, ptr->count++) ; 

24 Sem_post (mutex) ; 

25 } 

26 exit (0); 

27 ) 


pxshm/client1.c 








图 13-8 给 存放 在 共享 内 存 区 中 的 
获取 信号 量 并 给 计数 器 持续 加 1 
20~26 


一 个 计数 器 加 1 的 程序 


给 存放 在 所 打开 共享 内 存 区 中 的 计数 器 执行 由 命令 行 参数 


指定 次 数 的 加 1 操作 。 每 次 加 1 前 输出 该 计数 器 原来 的 值 以 及 当前 的 进程 





输出 进程 ID 是 因为 我 们 将 同时 运行 本 程序 的 多 个 


RITE eR SUIS d, 
solaris 96 server1 shm1 sem1 

和 信号 量 
solaris % client1 shm1 sem1 10000 & 
client shm1 sem1 10000 & 
[2] 17976 


然后 在 后 全 运行 客户 程序 的 


副本 。 
三 个 副本 。 
创建 并 初始 化 共 孚 和 内存 区 


client1 shm1 sem1 10000 & \ 


由 shell 输 出 的 各 个 进 


程 ID 
[3] 17977 
[4] 17978 
pid 17977: 0 进程 17977 首 先 运行 
pid 17977: 1 

T" 进程 17977 继 续 运 行 
pid 17977: 32 
pid 17976: 33 内 核 切换 上 下 文 到 进 

程 17976 

T 进程 17976 继 续 运 行 
pid 17976: 707 
pid 17978: 708 内 核 切换 上 下 文 到 进 

程 17978 

T 进程 17978 继 续 运 行 

pid 17978: 852 


pid 17977: 853 内 核 切换 上 下 文 到 进 
程 17977 

p 如 此 等 等 pid 17977: 
29998 

pid 17977: 29999 最 终 值 输出 ， 它 是 正确 
的 








13.6 回 一 个 有 5c 39s YES EA 





现在 对 我 们 的 生产 者 -消费 者 例子 作 如 下 修改 。 服 务 器 局 动 后 创建 
一 个 共享 内 存 区 对 象 ， 各 个 客户 进程 就 在 其 中 放置 消 奶 。 我 们 的 服务 器 
只 是 输出 这 些 消 轧 ， 不 过 可 以 一 般 化 为 做 类 似 于 syslog 守 护 进程 所 做 之 


事 ， 该 守护 进程 在 UNPv1 第 13 章 中 讲述 。 我 们 把 其 他 进程 称 为 客户 ， 因 
为 它们 相对 于 我 们 的 服务 器 呈现 为 客户 ， 但 是 它们 也 可 以 是 某 种 处 理 其 
他 客户 的 服务 器 。 举 例 来 说 ，Telnet 服 务 器 在 向 syslog 守 护 进 程 发 送 登 记 
消息 时 就 是 后 者 的 一 个 客户 。 

我 们 没有 使 用 第 二 部 分 中 讲述 的 某 种 消息 传递 技术 ， 而 是 使 用 共享 
内 存 区 来 容纳 消息 。 当 然 ， 这 使 得 我 们 有 必要 在 存 入 消息 的 各 个 客户 和 
取 走 并 输出 消息 的 服务 器 之 间 采 取 某 种 形式 的 同步 。 图 13-9 展 示 了 总 体 


设计 。 





含有 信和 号 量 和 消息 的 共享 内 存 区 






创建 并 初始 化 取出 下 一 个 消息 并 输出 


服务 器 








图 13-9 多 个 客户 通过 共享 内 存 区 问 一 个 服务 器 发 送 消 息 
这 儿 有 多 个 生产 者 “〈 客 户 ) 和 单个 消费 者 〈 服 务 器 ) 。 共 享 内 存 区 
既 出 现在 服务 器 的 地 址 空间 ， 也 出 现在 各 个 客户 的 地 址 空间 。 
图 13-10 是 我 们 的 cliserv2.h 头 文件 ， 它 定义 了 一 个 给 出 共享 内 存 区 
对 象 布局 的 结构 。 








pxshm/cliserv2.h 





1 #include "unpipc.h" 


2 #define MESGSIZE 256 /* max #bytes per message, incl. null at end */ 
3 #define NMESG 16 /* max #messages */ 

4 struct shmstruct { /* struct stored in shared memory */ 

5 sem t mutex; /* three Posix memory-based semaphores */ 

6 sem t nempty; 

7 sem t nstored; 

8 int nput; /* index into msgoff[] for next put */ 

9 long noverflow; /* #overflows by senders */ 

10 sem t noverflowmutex; /* mutex for noverflow counter */ 

11 long msgof f [NMESG] ; /* offset in shared memory of each message */ 
12 char msgdata[NMESG * MESGSIZE]; /* the actual messages */ 





pxshm/cliserv2.h 








图 13-10 定义 共享 内 存 区 布局 的 头 文件 

基本 的 信号 量 和 变量 

5~8 mutex、nempty 和 nstored 这 三 个 Posix 基 于 内 存 的 信号 量 与 10.6 
节 里 生产 者 -消费 者 例子 中 的 同名 信号 量 作 用 相同 。 变 量 nput 是 用 于 存放 
一 个 消息 的 下 一 个 位 置 的 下 标 (0、1、...、NMESG-1) 。 既 然 我 们 有 
多 个 生产 者 ， 该 变量 就 必须 存放 在 共 — 并 且 只 能 在 持 有 
mutex 期 间 访问 。 

溢出 计数 器 

9 一 10 ” 某 个 客户 想 发 送 一 个 消息 ， 但 是 所 有 的 消息 槽 位 都 被 占用 
了 ， 发 生 这 种 情况 的 可 能 性 是 存在 的 。 但 是 如 果 该 客户 实际 上 同时 又 是 
某 种 类 型 的 一 个 服务 器 〈( 壁 如 说 是 一 个 FTP 服务 器 或 HTTP 服 务 器 〉， 
那么 它 可 能 不 愿意 等 竺 服务 器 释放 出 一 个 槽 位 。 因 此 ， 我 们 将 把 客户 程 
序 编写 成 发 生 这 种 情况 时 并 不 阻塞 ， 而 是 给 noverflow 计 数 器 加 1。 由 于 
该 溢出 计数 器 也 是 在 所 有 客户 和 服务 器 之 间 共 享 的 ， 因 此 它 也 需要 一 个 
Aa, Ui HE EZA. 

消息 偏 移 和 数据 

11—12 数组 msgoff 含 有 针对 msgdata 数 组 的 各 个 偏 移 ， 指 出 了 每 个 
消息 的 起 始 位 置 。 这 就 是 说 ，msgoff[0] 为 0，msgoff[1] 为 
256 (MESGSIZE 的 值 ) ，msgoff[2] 为 512， 等 等 。 


























必须 搞 清楚 在 处 理 共 享 内 存 区 时 ， 我 们 只 能 使 用 像 这 样子 的 偏 移 
(offset) ， 因 为 共享 内 存 区 对 象 可 映射 到 映射 它 的 各 个 进程 的 不 同 物 
理 地 址 。 也 就 是 说 ， 对 于 同一 个 共享 内 存 区 对 象 ， 调 用 mmap 的 每 个 进 
程 所 得 到 的 mmap 返 回 值 可 能 不 同 。 由 于 这 个 原因 ， 我 们 不 能 在 共享 内 
存 区 对 象 中 使 用 指针 pointer) ， 因 为 它们 含有 存放 在 这 些 对 象 内 各 变 
量 的 实际 地 址 。 

图 13-11 是 我 们 的 服务 器 程序 ， 它 等 待 某 个 客户 往 所 指定 的 共享 内 
存 区 中 放置 一 个 消息 ， 然 后 输出 这 个 消 

创建 共享 内 存 区 对 象 

10~16 首先 调用 shm_unlink 删 除 可 能 仍然 存在 的 共享 内 存 区 对 象 。 
接着 使 用 shm_open 创 建 这 个 对 象 ， 再 使 用 mmap 把 它 映射 到 调用 进程 的 
地 址 空间 。 然 后 关闭 它 的 描述 符 。 

初始 化 偏 移 量 数组 

17 一 19 把 偏 移 量 数组 msgoff 初 始 化 为 含有 每 个 消 奶 的 位 置 偏 移 。 

初始 化 信号 量 

20—24 ”初始 化 存放 在 共 至 内 存 区 对 象 中 的 四 个 基于 内 存 的 信号 
量 。 每 个 sem_init 调 用 的 第 二 个 参数 都 不 为 0， 因 为 这 些 信 号 量 将 在 进程 
HEF. 

SB, Nd h 

25—36 ”for 循环 的 前 半 部 分 是 标准 的 消费 者 算法 : 等 待 nstored 变 为 
大 于 0， 等 待 mutex， 处 理 数据 ， 释 放 mutex， 然 后 给 nempty 加 1。 

处 理 淤 出 

37—43 ”每 次 经 由 这 个 循环 ， 我 们 还 检查 是 否 淤 出 。 我 们 测试 计数 
器 noverflows 的 值 是 否 不 同 于 上 一 次 的 值 ， 知 是 则 输出 并 保存 这 个 新 
值 。 注 意 ， 我 们 是 在 持 有 noverflowmutex 信 和 号 量 期 间 获 取 该 计数 器 的 值 
的 ， 但 在 比较 并 输出 它 之 前 先 释 放 了 这 个 信号 量 。 这 么 一 来 展示 了 如 下 
的 一 般 规 则 : 我 们 应 该 把 持 有 某 个 互 斥 锁 期 间 执行 的 代码 编写 得 操作 总 











suv O 














pxshm/server2.c 


1 #include "cliserv2.h" 
2. int 
3 main(int argc, char **argv) 
a 
5 int fd, index, lastnoverflow, temp; 
6 long offset; 
y struct shmstruct*ptr; 
8 i£ (arge I= 2) 
9 err_quit ("usage: server2 <name>"); 
10 /* create shm, set its size, map it, close descriptor */ 
11 shm unlink(Px ipc name (argv[11)); /* OK if this fails */ 
12 fd - Shm open(Px ipc name(argv[1]), O RDWR | O CREAT | O EXCL, FILE MODE); 
13 ptr - Mmap(NULL, sizeof(struct shmstruct), PROT READ | PROT WRITE, 
14 MAP SHARED, fd, 0); 
15 Ftruncate(fd, sizeof(struct shmstruct)); 
16 Close (fd); 
127 /* initialize the array of offsets */ 
18 for (index = 0; index < NMESG; index++) 
19 ptr-»msgoff[index] - index * MESGSIZE; 
20 /* initialize the semaphores in shared memory */ 
23. Sem init(&ptr-»mutex, 1, 1); 
22 Sem init(&ptr-»nempty, 1, NMESG); 
23 Sem init(&ptr-»nstored, 1, 0); 
24 Sem init(&ptr-»noverflowmutex, 1, 1); 
25 /* this program is the consumer */ 
26 index - 0; 
27 lastnoverflow - 0; 
28 for (s: 3) q 
29 Sem wait (&ptr->nstored) ; 
30 Sem wait (&ptr->mutex) ; 
31 offset - ptr-»msgoff [index]; 
32 printf ("index = %d: %s\n", index, &ptr-»msgdata [offset]); 
33 if (++index >= NMESG) 
34 index = 0; /* circular buffer */ 
35 Sem_post (&ptr->mutex) ; 
36 Sem post (&ptr->nempty) ; 
37 Sem_wait (&ptr->noverflowmutex) ; 
38 temp = ptr->noverflow; /* don't printf while mutex held */ 
39 Sem_post (&ptr->noverflowmutex) ; 
40 if (temp != lastnoverflow) { 
41 printf ("noverflow = %d\n", temp); 
42 lastnoverflow = temp; 
43 } 
44 } 
45 exit (0) ; 
46 } 


pxshm/server2.c 


图 13-11 从 共享 内 存 区 中 取得 并 输出 消息 的 服务 器 程序 


图 13-12 给 出 了 我 们 的 客户 程序 。 


pxshm/client2.c 





1 #include "Cliserv2.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int fd, i, nloop, nusec; 

6 pidt pid; 

7 char mesg [MESGSIZE] ; 

8 long offset; 

9 struct shmstruct*ptr; 
10 if (argc != 4) 

11 err quit ("usage: client2 <name> <#loops> <#usec>") ; 
T2 nloop = atoi(argv[21); 

13 nusec = atoi (argv [3]); 

14 /* open and map shared memory that server must create */ 
15 fd = Shm open(Px ipc name(argv[1]), O_RDWR, FILE MODE); 
16 ptr - Mmap(NULL, sizeof(struct shmstruct), PROT READ | PROT WRITE, 
17 MAP SHARED, fd, 0); 

18 Close (fd); 

19 pid = getpid(); 
20 for (i = 0; i < nloop; i++) { 
21 Sleep_us (nusec) ; 
22 snprintf (mesg, MESGSIZE, "pid %ld: message %d", (long) pid, i); 
23 if (sem trywait(&ptr-»nempty) == -1) { 
24 if (errno == EAGAIN) { 
25 Sem_wait (&ptr->noverflowmutex) ; 
26 ptr->noverflow++; 
27 Sem_post (&ptr->noverflowmutex) ; 
28 continue; 
29 } else 
30 err sys("sem trywait error"); 

31 } 

32 Sem_wait (&ptr->mutex) ; 

33 offset = ptr-»msgoff [ptr-»nput]; 

34 if (++(ptr->nput) >= NMESG) 

35 ptr->nput = 0; /* circular buffer */ 

36 Sem_post (&ptr->mutex) ; 

37 strcpy(&ptr-»msgdata [offset], mesg) ; 

38 Sem_post (&ptr->nstored) ; 

39 } 
40 exit (0); 
41 } 





pxshm/client2.c 





图 13-12 在 共享 内 存 区 中 给 服务 器 存放 消息 的 客户 程序 
命令 行 参数 
10~13 第 一 个 命令 行 参数 是 共享 内 存 区 对 象 的 名 字 ， 下 一 个 是 给 
服务 器 存放 的 消息 数 ， 最 后 一 个 是 每 次 存放 消息 之 间 停顿 的 微 秒 数 。 通 
过 启动 本 客户 程序 的 多 个 副本 并 指定 一 个 较 小 的 停顿 值 ， 我 们 可 以 强行 

















造成 溢出 ， 然 后 验证 服务 器 能 正确 地 处 理 它 。 

打开 并 映射 共享 内 存 区 

14—18 ”在 假设 所 指定 的 共享 内 存 区 对 象 已 经 存在 的 前 提 下 ， 我 们 
打开 该 对 象 ， 然 后 把 它 映 射 到 当前 进程 的 地 址 空间 。 随 后 关闭 它 的 描述 
符 。 








存放 消息 

19—31 客户 程序 接着 依循 基本 的 生产 者 算法 工作 ， 不 过 我 们 把 组 
冲 区 中 没有 存放 新 消 奶 的 空间 时 生产 者 阻塞 在 其 中 的 sem_wait(nempty) 
换 成 了 不 会 了 蛆 窗 的 sem_trywait 调 用 。 如 果 nempty 信 号 量 的 值 为 0， 
函数 就 返回 一 个 EAGAIN 错 误 。 我 们 检测 出 该 错误 后 给 洲 出 计数 费 加 





sleep_us 是 来 自 APUE 图 C.9 和 图 C.10 的 一 个 函数 。 它 睡眠 指定 数目 
的 微 秒 数 ， 是 通过 调用 select 和 poll 来 实现 的 。 

32—37 “我们 在 持 有 mutex 信 号 量 期 间 取得 offset 的 值 并 给 nputj 如 1， 
(HE BE RAE STE ER BSE SA KZ A EI f mutex. TERA IZ 
信号 量 期 间 ， 我 们 只 应 该 执行 那些 必须 被 保护 起 来 的 操作 。 

我 们 首先 在 后 台 局 动 服 务 器 ， 然 后 运行 一 个 客户 ， 给 它 指定 50 个 待 
存放 消 轧 ， 每 个 消 妃 的 存放 没有 彼此 间 的 停顿 。 

solaris % server2 serv2 & 

[2] 27223 


solaris 96 client2 serv2 50 0 











index = 0: pid 27224: message 0 

index = 1: pid 27224: message 1 

index = 2: pid 27224: message 2 

jg 如 此 继续 index = 15: 
pid 27224: message 47 

index = 0: pid 27224: message 48 


index = 1: pid 27224: message 49 CB IB RER 

但 是 当 我 们 再 次 运行 一 个 客户 时 ， 却 看 到 了 一 些 溢出 现象 : 

solaris % client2 serv2 50 0 

index = 2: pid 27228: message 0 

index = 3: pid 27228: message 1 

nos 仍然 正常 index = 10: 
pid 27228: message 8 

index = 11: pid 27228: message 9 

noverflow = 25 服务 器 检测 到 有 25 个 
消息 丢失 index = 12: pid 27228: message 10 

index = 13: pid 27228: message 11 

sag 4 消息 12 一 22 仍 然 正常 
index = 9: pid 27228: message 23 

index = 10: pid 27228: message 24 

这 一 次 该 客户 呈现 为 存放 了 消息 0 一 9， 它 们 由 服务 器 取 走 并 和 输出。 
该 客户 继续 运行 ， 准 备 存 放 消 息 10 一 49， 但 是 共享 内 存 区 中 只 有 存放 其 
中 前 15 个 消息 的 空间 ， 于 是 剩余 的 25 个 消息 《编号 为 25 一 49) 因 溢 出 而 
未 被 存放 。 

很 明显 ， 在 本 例子 中 通过 让 客户 尽 可 能 快 地 产生 消 轧 ， 而 且 每 次 存 
放 消 息 之 间 没 有 停顿 来 达到 溢出 效果 ， 不 过 这 并 不 是 一 种 典型 的 现实 情 
形 。 然 而 本 例子 的 目的 只 是 展示 客户 产生 的 消息 没有 存放 空间 可 用 ， 但 
是 客户 又 不 想 为 此 而 阻塞 的 情况 应 如 何 处 理 。 这 种 情况 并 不 是 只 有 共享 
内 存 区 才 有 的 ， 消 轧 队 列 、 管 道 和 FIFO 都 可 能 发 生 同 样 情况 。 

不 断 提供 数据 ， 造 成 接收 者 忙 不 过 来 的 情形 并 非 只 有 本 例子 出 现 。 
UNPv1 的 8.13 节 就 UDP 数据 报 和 UDP 套 接 字 接 收 缓冲 区 讨论 了 同样 情 
形 。TCPv3 的 18.2 节 讲述 了 接收 者 的 缓冲 区 发 生 溢出 时 ，Unix 域 数据 报 
套 接 字 是 如 何 向 发 送 者 返回 一 个 ENOBUFS 错 误 的 。 在 图 13-12 中 ， 我 们 


























的 客户 《发 送 者 ) 知道 什么 时 候 服务 器 的 缓冲 区 溢出 了 ， 因 此 要 是 把 这 
段 代码 放 到 茶 个 供 其 

他 程序 调用 的 通用 函数 中 ， 那 么 当 服 务 器 的 绥 冲 区 溢出 时 ， 该 函数 
有 可 能 回调 用 者 返回 一 个 错误 。 


13.7 "Zi 


Posix 共 享 内 存 区 构筑 在 上 一 章 讲 述 的 mmap 函 数 之 上 。 我 们 首先 指 
定 待 打开 共享 内 存 区 的 Posix IPC 名 字 来 调用 shm_open， 取 得 一 个 描述 符 
后 使 用 mmap 把 它 映射 到 内 存 。 其 结果 类 似 于 内 存 上 映射 文件 ， 不 过 共享 
内 存 区 对 象 不 必 作 为 一 个 文件 来 实现 。 

既然 共享 内 存 区 对 象 是 由 擅 述 符 来 表示 的 ， 它 们 的 大 小 就 使 用 
ftruncate 来 设置 ， 有 关 某 个 已 存在 对 象 的 信息 《保护 位 、 用 户 ID、 组 ID 
BK) 由 fstat 返 回 。 

在 讨论 Posix 消 息 队 列 和 Posix 信 号 量 时 ， 我 们 分 别 在 5.8 节 和 10.15 节 
提供 了 它们 基于 内 存 映射 TO 的 实现 。 我 们 不 对 Posix 共 享 内 存 区 提供 这 
样 的 实现 ， 因 为 实在 太 简 单 。 如 果 愿 意 以 内 存 映射 一 个 文件 的 方式 〈 这 
在 Solaris 和 Digital Unix 上 都 有 实现 ) 来 实现 Posix 共 享 内 存 区 这 种 IPC 形 
式 ， 那 么 shm_open 是 通过 调用 open 实 现 的 ，shm_unlink 是 通过 调用 
unlink 实 现 的 。 











习题 





13.1 把 图 12-16 和 图 12-19 修 改 成 访问 Posix 共 享 内 存 区 而 不 是 内 存 映 
射 文件 ， 并 验证 它们 的 运行 结果 与 原来 访问 内 存 映 射 文件 的 程序 相同 。 

13.2 ”在 图 13-4 和 图 13-5 的 for 循 环 中 ， 用 于 步 进 访问 数组 元 素 的 C 表 
达 式 为 *ptr++。 改 用 ptr[ 计 更 为 可 取 吗 ? 





第 14 章 System VE E A f£ [X 
14.1 概述 


System V 共 享 内 存 区 在 概念 上 类 似 于 Posix 共 享 内 存 区 。 代 之 以 调用 
shm_open 后 调用 mmap 的 是 ， 先 调用 shmget， 再 调用 shmat。 

对 于 每 个 共享 内 存 区 ， 内 核 维 护 如 下 的 信息 结构 ， 它 定义 在 
<Sys/shm.h> 头 文件 中 : 

struct shmid_ds { 





struct ipc_perm shm_perm; /* operation permission struct */ 
size_t shm_segsz; /* segment size */ 

pid_t shm lpid; /* pid of last operation */ 

pid t shm cpid; /* creator pid */ 

shmatt t shm nattch;  /* current # attached */ 

shmat t shm cnattch; /* in-core # attached */ 

time t shm atime; /* last attach time */ 

time t shm dtime; /* last detach time */ 

time t shm ctime; /* last change time of this 


structure */ 
H 
我 们 已 在 3.3 节 描述 过 其 中 的 ipc_perm 结 构 ， 它 含有 本 共享 内 存 区 的 
访问 权限 。 


14.2 shmget PK 2i 





shmget 疯 数 创建 一 个 新 的 共 至 内 存 区 ， 或 者 访问 一 个 已 存在 的 共 至 
内 存 区 。 

#include <sys/shm.h> 

int shmget(key_t key,size_t size,int oflag); 

返回 : AMT ASE SA KTR, ea bA- 

返回 值 是 一 个 称 为 共享 内 存 区 标识 符 Cshared memory identifier) 的 
整数 ， 其 他 三 个 shmXXX 函 数 就 用 它 来 指 代 这 个 内 存 区 。 

key 既 可 以 是 ftok 的 返回 值 ， 也 可 以 是 IPC_PRIVATE， 我 们 已 在 3.2 
节 讨 论 过 。 

size 以 字 贡 为 单位 指定 内 存 区 的 大 小 。 当 实际 操作 为 创建 一 个 新 的 
共享 内 存 区 时 ， 必 须 指定 一 个 不 为 0 的 size 值 。 如 果实 际 操作 为 访问 一 个 
己 存 在 的 共享 内 存 区 ， 那 么 size 应 为 0。 

oflag 是 图 3-6 中 所 示 读 写 权 限 值 的 组 合 。 它 还 可 以 与 PC_CREAT 或 
IPC_CREAT | IPC_EXCL 按 位 或 ， 如 随 图 3-4 所 作 的 讨论 。 

当 实 际 操作 为 创建 一 个 新 的 共 圣 内 存 区 时 ， 该 内 存 区 被 初始 化 为 
size 字 节 的 0。 

注意 ，shmget 创 建 或 打开 一 个 共享 内 存 区 ， 但 并 没有 给 调用 进程 提 
供 访问 该 内 存 区 的 手段 。 这 是 shmat 函 数 的 目的 ， 我 们 将 接 下 去 讲述 
Bs 








14.3 shmat pki% 


由 shmget 创 建 或 打开 一 个 共享 内 存 区 后 ， 通 过 调用 shmat 把 它 附 接 
到 调用 进程 的 地 址 空间 。 
#include <sys/shm.h> 


void *shmat(int shmid,const void *shmaddr, int flag); 


返回 : Epp AUI ARR DC BER A OE, eb e A 


=| 

其 中 shmid 是 由 shmget 返 回 的 标识 符 。shmat 的 返回 值 是 所 指定 的 共 
享 内 存 区 在 调用 进程 内 的 起 始 地 址 。 确 定 这 个 地 址 的 规则 如 下 。 

如 果 shmaddr 是 一 个 空 指针 ， 那 么 系统 蔡 调 用 者 选择 地 址 。 这 是 推 
荐 的 (也 是 可 移植 性 最 好 的 ) 方法 。 

如 果 shmaddr 一 是 一 个 非 空 指针 ， 那 么 返回 地 址 取决 于 调用 者 是 否 
给 flag 参 数 指定 了 SHM_RND 值 : 

如 果 没 有 指定 SHM_RND， 那 么 相应 的 共享 内 存 区 附 接 到 由 
shmaddr 参 数 指定 的 地 址 ; 如果 指 是 了 SHM_RND， 那 么 相应 的 共 诗 内 
存 区 附 接 到 由 shmaddr 参 数 指定 的 地 址 问 下 舍 入 一 个 SHMLBA 常 值 。 
LBA 代 表 “ 低 端 边 界 地 址 (ower boundary address) ”。 

默认 情况 下 ， 只 要 调用 进程 具有 茶 个 共享 内 存 区 的 读 写 权限 ， 它 附 
接 该 内 存 区 后 就 能 够 同时 读 写 该 内 存 区 。flag 参 数 中 也 可 以 指定 
SHM_RDONLY 值 ， 它 限定 只 读 访问 。 


14.4 shmdt FA ži 


2p ERES MR PSE EAN FEA EAE “EY H shard br Eix 
个 内 存 区 。 


#include <sys/shm.h> 











int shmdt(const void *shmaddr); 
返回 : AMANO, ABENA- 
当 一 个 进程 终止 时 ， 它 当前 附 接 着 的 所 有 共享 内 存 区 都 自动 断 接 
fri. 
注意 本 函数 调用 并 不 删除 所 指定 的 共享 内 存 区 。 这 个 删除 工作 通过 
以 IPC_RMID 命 令 调用 shmctl 完 成 ， 我 们 将 在 下 一 节 讲 述 它 。 








14.5 shmctl pf Zi 


shmctl 提 供 了 对 一 个 共享 内 存 区 的 多 种 操作 。 

#include <sys/shm.h> 

int shmctl(int shmid,int cmd,struct shmid ds *buff); 

该 函数 提供 了 三 个 命令 。 

返回 : 大 成 功 则 为 0， 知 出 错 则 为 -1 

IPC_RMID 从 系统 中 删除 由 shmid 标 识 的 共享 内 存 区 并 拆除 它 。 [3] 

IPC_SE. 给 所 指定 的 共享 内 存 区 设置 其 shmid ds 结构 的 以 下 三 个 成 
员 : shm_perm.uid、shm_perm.gid 和 shm_perm.mode， 它 们 的 值 来 自 buff 
参数 指向 的 结构 中 的 相应 成 员 。shm_ctime 的 值 也 用 当前 时 间 奉 换 。 

IPC STAT 《通过 buff 参 数 ) 向 调用 者 返回 所 指定 共享 内 存 区 当前 
的 shmid_ds 结 构 。 


N 





14.6 fis FE] TE 


我 们 现在 开发 一 些 对 System V 共 享 内 存 区 进行 操作 的 简单 程序 。 

14.6.1 shmget 程 序 

图 14-1 给 出 的 shmget 程 序 使 用 指定 的 路 径 名 和 长 度 创建 一 个 共享 内 
存 区 。19 shmget 创 建 由 用 户 指定 其 名 字 和 大 小 的 共享 内 存 区 。 作 为 命令 
行 参数 传递 进来 的 路 径 名 由 ftok 了 映射 成 一 个 System V IPC 键 。 如 果 指 定 
了 -e 选 项 ， 那 么 一 旦 该 内 存 区 已 存在 就 会 出 错 。 如 果 我 们 知道 该 内 存 区 
已 存在 ， 那 么 在 命令 行 上 的 长 度 参数 必须 指定 为 0。20 shmat 把 该 内 存 区 
附 接 到 当前 进程 的 地 址 空间 。 本 程序 然后 终止 ， 不 过 既然 System V 共 享 
内 存 区 至 少 具 有 随 内 核 的 持续 性 ， 那 么 这 不 会 删除 该 共享 内 存 区 。 











svshm/shmget.c 


1 #include "unpipc.h" 

2 nt 

3 main(int argc, char **argv) 

4 { 

5 int c, id, oflag; 

6 char *ptr; 

7 size t length; 

8 oflag - SVSHM MODE | IPC CREAT; 

9 while ( (c = Getopt(argc, argv, "e")) !- -1) { 
10 switch (c) ( 

11 case 'e': 

12 oflag |- IPC EXCL; 

13 break; 

14 ) 

15 } 

16 if (optind != argc - 2) 

17 err quit("usage: shmget [ -e ] <pathname> <length>") ; 
18 length = atoi(argv[optind + 1]); 

19 id = Shmget (Ftok(argv[optind], 0), length, oflag) ; 
20 ptr = Shmat(id, NULL, 0); 

21 exit (0) ; 

22: 外 








svshm/shmget.c 


图 14-1 创建 一 个 指定 大 小 的 System V 共 享 内 存 区 
14.6.2 shmrmid 程 序 
图 14-2 给 出 的 简单 程序 只 是 以 一 个 IPC_RMID 命 令 调用 shmctl， 以 便 
从 系统 中 删除 一 个 共享 内 存 区 。 


svshm/shmrmid.c 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int id; 

6 if (argc != 2) 

7 err quit("usage: shmrmid <pathname>") ; 
8 id - Shmget(Ftok(argv[1], 0), 0, SVSHM MODE); 
9 Shmctl(id, IPC RMID, NULL); 

10 exit(0); 

11 ) 


svshm/shmrmid.c 





图 14-2 删除 一 个 System V 共 享 内 存 区 


14.6.3 shmwrite 程 序 


图 14-3 给 出 了 shmwrite 程 序 ， 它 往 一 个 共享 内 存 区 中 写 入 一 个 模 
IÑ: 0, Ts 25 "PP 254, 255; 0, ls 408 


svshm/shmwrite.c 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

a { 

5 int i, id; 

6 struct shmid ds buff; 

7 unsigned char *ptr; 

8 if (argc != 2) 

9 err quit("usage: shmwrite <pathname>") ; 
10 id - Shmget(Ftok(argv[1], 0), 0, SVSHM MODE); 
mu ptr = Shmat(id, NULL, 0); 

12 Shmctl(id, IPC STAT, &buff); 

13 /* set: ptr[0] = 0, ptr[1] = 1, etc. */ 
14 for (i = 0; i « buff.shm segsz; i++) 

15 *ptr++ = i $ 256; 

16 exit (0); 

17 } 


svshm/shmwrite.c 





图 14-3 打开 一 个 共享 内 存 区 ， 填 入 一 个 数据 模式 


10—12 使 用 shmget 打 开 所 指定 的 共享 内 存 区 后 由 shmat 把 它 附 接 到 
当前 进程 的 地 址 空间 。 其 大 小 通过 以 一 个 IPC_STAT 命 令 调用 shmct 取 


Z| 
Sf o 








13~15 往 该 共享 内 存 区 中 写 入 给 定 的 模式 。 
14.6.4 shmread 程 序 
图 14-4 给 出 的 shmread 程 序 会 验证 由 shmwrite 写 入 的 模式 。 





svshm/shmread.c 
1 #include "unpipc.h" 


2 int 

3 main(int argc, char **argv) 

4 ( 

5 int i, ad: 

6 struct shmid ds buff; 

g unsigned char c, *ptr; 

8 if (argc != 2) 

9 err quit("usage: shmread <pathname>") ; 

10 id - Shmget(Ftok(argv[1], 0), 0, SVSHM MODE); 
11 ptr - Shmat(id, NULL, 0); 

12 Shmctl(id, IPC STAT, &buff); 

13 /* check that ptr[0] = 0, ptr[1] = 1, etc. */ 
14 for (i = 0; i « buff.shm segsz; i++) 

15 BE (6 (c m *peres) de (4. €* 256)) 

16 err ret("ptr[$d] = $d", i, c); 

17 exit(0); 

18 } 


svshm/shmread.c 























图 14-4 打开 一 个 共享 内 存 区 ， 验 证 其 数据 模式 


10~12 打开 并 附 接 所 指定 的 共享 内 存 区 。 其 大 小 通过 以 一 个 
IPC_STAT 命 令 调 用 shmct 获 取 。13 一 16 验证 由 shmwrite 写 入 的 模式 。 

14.6.5 例子 

在 Solaris ”2.6 下 创建 一 个 大 小 为 1234 字 节 的 共享 内 存 区 。 用 于 标识 
该 内 存 区 的 路 径 名 (也 就 是 传递 给 ftok 的 路 径 名 〉 是 我 们 的 shmget 可 执 
行文 件 的 路 径 名 。 对 于 一 个 给 定 的 应 用 ， 使 用 服务 器 的 可 执行 文件 路 径 
名 往往 能 够 提供 一 个 唯一 的 标识 符 。 

solaris % shmget shmget 1234 





solaris % ipcs -bmo 


IPC status from <running system> as of Thu Jan 8 13:17:06 1998 


T ID KEY MODE 
OWNER GROUP NATTCH SEGSZ 

m 1 Ox0000f12a --rw-r--r-- rstevens other1 
0 1234 Shared Memory: 





我 们 运行 ipcs 程 序 以 验证 相应 的 共享 内 存 区 已 经 创建 出 来 。 注 意 它 





的 附 接 数 《存放 在 该 内 存 区 的 shmid_ds 结 构 的 shm_nattch 成 员 中 ) 为 0， 
跟 我 们 预期 的 一 致 。 

接着 运行 我 们 的 shmwrite 程 序 ， 以 把 该 共 圣 内 存 区 的 内 容 设 置 成 给 
定 的 模式 。 然 后 用 shmread 验 证 该 共享 内 存 区 的 内 容 ， 并 删除 其 标识 
符 。 

solaris % shmwrite shmget 

solaris % shmread shmget 

solaris % shmrmid shmget 

solaris % ipcs -bmo 


IPC status from «running system? as of Thu Jan 8 13:17:06 1998 


T ID KEY MODE 
OWNER GROUP NATTCH SEGSZ 
Shared Memory: 


我 们 运行 ipcs 来 验证 该 共享 内 存 区 确实 已 被 删除 。 

当 把 服务 器 可 执行 文件 的 名 字 用 作 ftok 的 参数 来 标识 茶 种 形式 的 
System V IPC 时 ,通常 应 使 用 绝对 路 径 名 【例如 /usr/bin/myserverd) ， 
而 不 是 像 本 例子 那样 使 用 一 个 相对 路 径 名 (shmget〉 。 我 们 能 在 本 节 的 
例子 中 使 用 相对 路 径 名 的 原因 是 ， 所 有 程序 都 是 从 含有 服务 器 可 执行 文 
件 的 目录 中 运行 的 。 我 们 知道 ftok 使 用 文件 的 索引 节点 来 构成 卫 C 标 识 符 
〈 见 图 3-2) ， 而 一 个 给 定 文 件 是 使 用 一 个 绝对 路 径 名 还 是 一 个 相对 路 
径 名 来 引用 对 于 其 索引 节点 并 没有 影 啊 。 














14.7 共享 X | 


跟 System V 消 息 队 列 和 System V 信 号 量 一 样 ，System V 共 享 内 存 区 
也 存在 特定 的 系统 限制 〈3.8 节 ) 。 图 14-5 给 出 了 本 书 所 用 两 种 不 同 实现 
的 这 些 限 制 值 。 其 中 第 一 栏 是 含有 当前 限制 值 的 内 核 变量 的 传统 System 
VAT. 


-个 共享 内 存 区 的 最 大 字 节 数 4 194 304 1 048 576 
一 个 共享 内 存 区 的 最 小 字 # 数 | 1 | 1 











系统 范围 最 大 共享 内 存 区 标识 特 数 | 8 | 10 | 
每 个 进程 附 接 的 最 大 共享 内 丰 数 | 32 | 6 | 


图 14-5 System V 共 享 内 存 区 的 典型 系统 限制 





例子 
图 14-6 中 的 程序 可 确定 图 14-5 中 给 出 的 四 个 限制 值 。 





bh 


N 


o yAn euw 


#include "unpipc.h" 
Hdefine MAX NIDS 4096 
int 
main(int argc, char **argv) 
{ 
int i, j, shmid[MAX NIDS]; 
void *addr[MAX NIDS]; 
unsigned long size; 
/* see how many identifiers we can "open" */ 
for (i = 0; i <= MAX NIDS; i++) { 
shmid[i] = shmget (IPC_PRIVATE, 1024, SVSHM MODE | IPC CREAT); 
if (shmid[i] == -1) { 
printf ("%d identifiers open at once\n", i); 
break; 
} 
} 
for (j = 0; j < i; j++) 
Shmctl(shmid[j], IPC RMID, NULL); 
/* now see how many we can "attach" */ 
for (i = 0; i <= MAX NIDS; i++) { 


图 14-6 确定 共享 内 存 区 的 系统 限制 


svshm/limits.c 





21 shmid[i] = Shmget(IPC PRIVATE, 1024, SVSHM MODE | IPC CREAT); 





22 addr[i] = shmat(shmid[i], NULL, 0); 
23 if (addr[i] == (void *) -1) { 
24 printf ("sd shared memory segments attached at once\n", i); 
25 Shmctl(shmid[i], IPC RMID, NULL); /* the one that failed */ 
26 break; 
27 ) 
28 ) 
29 for (j = 0; j <i; je) ( 
30 Shmdt (addr [j] ) ; 
31 Shmctl(shmid[j], IPC RMID, NULL); 
32 ) 
33 /* see how small a shared memory segment we can create */ 
34 for (size = 1; ; size++) { 
35 shmid[0] = shmget(IPC PRIVATE, size, SVSHM MODE | IPC CREAT); 
36 if (shmid[0] != -1) { /* stop on first success */ 
37 printf ("minimum size of shared memory segment = %lu\n", size); 
38 Shmctl(shmid[0], IPC RMID, NULL); 
39 break; 
40 ) 
41 ) 
42 /* see how large a shared memory segment we can create */ 
43 for (size = 65536; ; size «- 4096) { 
44 shmid[0] - shmget(IPC PRIVATE, size, SVSHM MODE | IPC CREAT); 
45 if (shmid[0] == -1) ( /* stop on first failure */ 
46 printf("maximum size of shared memory segment = %lu\n", size-4096); 
47 break; 
48 } 
49 Shmctl(shmid[0], IPC RMID, NULL); 
50 ) 
51 exit(0); 
52 } 
svshm/limits.c 
图 14-6 (52) 


在 Digital Unix 4.0B 下 运行 这 个 程序 的 结果 为 : 

alpha % limits 

127 identifiers open at once 

32 shared memory segments attached at once 

minimum size of shared memory segment = 1 

maximum size of shared memory segment = 4194304 

图 14-5 指 出 128 个 标识 符 的 限制 ， 但 我 们 的 程序 只 能 创建 127 个 ， 其 
原因 在 于 有 一 个 系统 守护 进程 早已 创建 了 一 个 共享 内 存 区 。 


14.8 小 结 


System V 共 享 内 存 区 在 概念 上 与 Posix 共 享 内 存 区 类 似 。 最 常用 的 函 
数 调用 有 以 下 几 个 。 

shmget: 获取 一 个 标识 符 。 

shmat: 把 一 个 共享 内 存 区 附 接 到 调用 进程 的 地 址 空间 。 

以 一 个 IPC_STAT 命 令 调 用 shmctl: 获取 一 个 已 存在 共享 内 存 区 的 
大 小 。 

以 一 个 IPC_RMID 命 令 调用 shmctl: 删除 一 个 共享 内 存 区 对 象 。 

两 者 的 差别 之 一 是 ，Posix 共 宇内 存 区 对 象 的 大 小 可 在 任何 时 刻 通 
过 调用 ftruncate 修 改 〈 如 习题 13.1 中 所 展示 的 那样 ) ， 而 System VÆ 
内 存 区 对 象 的 大 小 是 在 调用 shmget 创 建 时 固定 下 来 的 。 





习题 





14.1 图 6-8 是 对 图 6-6 的 修改 ， 它 接受 的 用 于 指定 队列 的 是 标识 符 而 
不 是 路 径 名 。 我 们 已 展示 有 了 这 种 标识 符 ， 驶 足以 访问 一 个 System V 消 
恩 队 列 ( 假 设 我 们 有 足够 权限 ) 。 对 图 14-4 作 类 似 的 修改 ， 以 展示 同样 
的 特性 也 适用 于 System V 共 享 内存 区 。 





[1]. 确切 地 次， 从 观察 程序 运行 的 用 户 来 看 ， 组 冲模 式 的 标准 输出 妨碍 
了 父子 进程 动态 输出 的 及 时 反映 。 一 一 译 者 注 


[2]. 意思 是 不 像 调 用 read 和 write 执 行 WO 时 那样 由 内 核 直接 参与 VO 的 完 
成 ， 而 是 由 内 核 在 背后 通过 操纵 页 表 等 方法 间接 参与 ， 这 样 就 用 户 进 程 
看 来 ，IO 不 再 涉及 系统 调用 。 译 者 注 


[3]. 删除 一 个 共享 内 存 区 指 的 是 使 其 标识 符 失 效 ， 这 样 以 后 针对 该 标识 
符 的 shmat、shmdt 和 shmctl 函 数 调 用 必定 失败 。 拆 除 一 个 共享 内 存 区 指 
的 是 释放 或 回收 与 它 对 应 的 数据 结构 ， 包 括 删除 存放 在 其 上 的 数据 。 拆 
除 操作 要 到 该 共享 内 存 区 的 引用 计数 变 为 0 时 才 进 行 。 另 外 ， 当 某 个 








shmdt 调 用 发 现 所 指定 的 共享 内 存 区 的 引用 计数 变 为 0 时 也 顺便 拆除 它 ， 
这 就 是 shmctl 的 IPC_RMID 命 令 先 于 最 后 一 个 shmdt 调 用 发 出 时 会 发 生 的 
情形 。 译 者 注 








第 15 章 门 


15.1 概述 


当 讨 论 客户 -服务 器 情形 和 过 程 调 用 时 ， 存 在 着 三 种 不 同类 型 的 过 
程 调 用 ， 如 图 15-1 所 示 。 
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图 15-1 三 种 不 同类 型 的 过 程 调用 

(1) 本 地 过 程 调用 (local procedure call) : 这 是 我 们 从 日 常 的 C 编 程 
中 早 区 熟知 的 过 程 调用 ， 也 束 是 被 调用 的 过 程 〈 函 数 ) 与 调用 过 程 处 于 
同一 个 进程 中 。 典 型 情况 是 ， 调 用 者 通过 执行 某 条 机 器 指令 把 控制 传 给 
新 过 程 ， 被 调用 过 程 保存 机 器 寄存 器 的 值 ， 并 在 栈 顶 分 配 存 放 其 本 地 变 
量 的 空间 。 

(2) 远 程 过 程 调 用 (remote procedure call, RPC) : 被 调用 过 程 和 调 
用 过 程 处 于 不 同 的 进程 中 。 我 们 通常 称 调用 者 为 客户 ， 称 被 调用 的 过 程 
为 服务 器 。 在 图 15-1 中 间 的 情形 中 ， 我 们 展示 客户 和 服务 器 是 在 同一 台 
主机 上 执行 的 。 它 是 该 图 底部 的 情形 经 常会 友和 后 的 一 种 特殊 情况 ， 也 是 
l'] (door) adis : 一 个 进程 调用 同一 台 主 机 上 另 一 个 进程 中 的 
Fe PIE ARO 。 moe — ERE 
服务器) 就 使 得 该 过 程 能 为 其 他 进程 《客户 ) 所 调用 。 
为 门 是 一 种 特殊 类 型 的 IPPC， 因为 客户 和 服务 器 之 间 以 函数 参数 和 返 
值 形式 交换 信息 。 

(3)RPC 通 党 允许 一 台 主 机 上 的 某 个 客户 调用 男 一 台 主 机 上 的 某 个 服 
务 嚣 过程， 只 要 这 两 台 主 机 以 某 种 形式 的 网 络 连 接着 (图 15-1 底 部 的 情 

) 。 我 们 将 在 第 16 章 讲述 这 样 的 RPC。 

从 历史 上 说 ， 门 是 为 Spring 分 布 式 操作 系统 开发 的 ， 具 体 细 节 可 以 
从 http: /www.sun.com/tech/projects/spring 上 得 到 。 

[ Hamilto.an.Kougiouri.1993 ] 中 有 关于 该 操作 系统 中 门 IPC 机 制 的 一 个 
说 明 。 

后 来 门 添 加 到 了 Solaris 2.5 中 ， 不 过 有 关 它 的 唯一 手册 页 面 中 只 含 
有 一 个 警告 ， 说 门 是 仅 由 某 些 Sun 应 用 程序 使 用 的 一 个 试验 性 接口 。 到 
了 Solaris 2.6 后 ， 该 接口 的 文档 出 现在 8 个 手册 页 面 中 ， 不 过 这 些 手册 页 
面 把 该 接口 的 稳定 性 列 为 “进展 中 Cevolving) ”。 预 期 我 们 在 本 章 讲 述 
的 API 可 能 会 随 Solaris 将 来 版 本 的 出 现 而 发 生变 化 。Linux 上 门 接口 的 初 




















级 版 本 也 在 开发 中 ， 可 访问 http: //www.cs.brown.edu/--tor/doors. [1] 

Solaris 2.6 中 门 的 实现 涉及 一 个 函数 库 〈 它 含有 我 们 将 在 本 章 中 擂 
述 的 door_ XXX 函数 ) 和 一 个 内 核 文 件 系 统 Ckernel/sys/doorfs) ， 用 户 
的 应 用 程序 需 链 接 这 个 函数 库 〈 使 用 -ldoor 命 令 行 选 项 链接 程序 ) 。 

尽管 门 是 一 个 Solaris 特 有 的 特性 ， 我 们 还 是 详细 地 讲述 它 ， 因 为 它 
们 提供 了 很 不 错 的 远程 过 程 调 用 的 入 门 知 识 ， 又 不 必 对 付 任何 连 网 文 持 
细节 。 我 们 还 将 在 附录 A 中 看 到 ， 与 所 有 其 他 形式 的 消息 传递 机 制 相 比 
较 ， 门 不 是 更 快 也 至 少 一 样 快 。 

本 地 过 程 调用 是 同步 的 : 调用 者 直到 被 调用 过 程 返 回 后 才 重 新 获得 
控制 。 线 程 可 认为 是 提供 了 某 种 形式 的 异步 过 程 调 用 : 有 一 个 函数 被 调 
" (pthread_create 的 第 三 个 参数 ) ， 该 函数 和 调用 者 看 起 来 在 同时 执 

。 调 用 者 可 通过 调用 pthread_join 等 待 这 个 新 线程 的 完成 。 远 程 过 程 调 
ais 步 的 ， 也 可 能 是 异步 的 ， 不 过 我 们 将 看 到 门 调用 是 同步 的 。 

在 进程 (客户 或 服务 器 〉 内 部 ， 门 是 用 描述 符 标 识 的 。 在 进程 以 
外 ， Midi dae eq Rai indie 的 。 一 个 服务 器 通过 调用 
door REM 个 门 ， 传 递 给 该 函数 的 参数 是 将 hci 
ser ME hd 个 描述 符 。 该 服务 器 然后 
a. 这 个 门 描述 符 关 联 一 个 路 径 名 。 = 通过 调用 
HOME. 传递 给 该 函数 的 参数 是 该 门 的 服务 器 关联 在 其 上 的 
路 径 名 ， 该 函数 的 返回 值 是 本 客户 访问 该 门 的 描述 符 。 该 客户 然后 通过 
WARS 过 程 。 自 然 ， 某 个 门 的 服务 器 可 以 是 男 一 个 门 
的 客户 。 

我 们 说 过 门 调用 是 同步 的 : 当 客 户 调用 door_call 时 ， 该 函数 直到 服 
务 器 过 程 返回 〈 或 发 生 某 个 错误 ) 时 才 返 回 。 SOULS te 
相 联 系 。 每 当 有 一 个 客户 调用 某 个 服务 器 过 程 时 ， 服 务 器 进程 中 的 一 个 
线程 就 处 理 该 客户 的 调用 。 线 程 管理 通常 是 由 门 函数 库 自动 进行 的 ， 
函数 库 根 据 需要 创建 新 的 线程 ， 然 而 我 们 将 看 到 ， 如 果 需 要 服务 器 "s 

















杀 自 管理 这 些 线程 的 话 ， 它 应 该 怎么 去 做 。 这 还 意味 着 一 个 给 定 的 服务 
器 可 以 同时 为 多 个 客户 调用 同一 个 服务 器 过 程 提供 服务 ， 每 个 客户 一 个 
线程 。 这 是 一 个 并 发 (concurrent〉 服务 器 。 既 然 一 个 给 定 服务 器 过 程 
可 能 有 多 个 实例 在 同时 执行 (每 个 实例 作为 一 个 线程 ，， 因 此 服务 器 过 
程 必须 是 线程 安全 的 。 

调用 一 个 服务 器 过 程 时 ， 可 以 同时 从 客户 向 服务 器 传递 数据 和 描述 
符 。 也 可 以 同时 从 服务 器 向 客户 传递 回 数据 和 摘 述 符 。 描 述 符 传递 对 于 
门 来 说 是 内 在 的 。 而 且 ， 既 然 门 是 用 描述 符 标 识 的 ， 因 此 描述 符 传 递 允 
许 一 个 进程 把 一 个 门 传递 给 另外 某 个 进程 。 我 们 将 在 15.8 节 详细 讨论 描 
述 符 传递 。 

例子 

我 们 以 一 个 简单 的 例子 开始 关于 门 的 讨论 : 客户 回 服务 器 传递 一 个 
长 整数 ， 服 务 器 以 长 整数 结果 返回 该 值 的 平方 。 图 15-2 给 出 了 客户 程 
序 。【〔 我 们 在 本 例子 中 掩盖 了 许多 细节 ， 它 们 在 本 章 以 后 再 讨论 。) 


doors/clientl.c 























1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 int fd; 

6 long ival, oval; 

7 door arg t arg; 

8 if (arge != 3) 

9 err quit("usage: clientl <server-pathname> <integer-value>") ; 
10 fd - Open(argv[1], O RDWR); /* open the door */ 

11 /* set up the arguments and pointer to result */ 

12 ival - atol(argv[21); 

13 arg.data ptr - (char *) &ival; /* data arguments */ 

14 arg.data size = sizeof (long); /* size of data arguments */ 
15 arg.desc ptr = NULL; 

16 arg.desc_num = 0; 

17 arg.rbuf = (char *) &oval; /* data results */ 

18 arg.rsize = sizeof (long); /* size of data results */ 

19 /* call server procedure and print result */ 

20 Door call(fd, &arg); 

213 printf("result: $1dWMn", oval); 

22 exit (0); 


doors/clientl.c 




















图 15-2 向 服务 器 发 送 一 个 长 整数 以 求 取 其 平方 值 的 客户 








打开 门 

8 一 10 调用 open 打 开 由 命令 行 上 的 路 径 名 指定 的 门 。 所 返回 的 描述 
符 称 为 门 描 述 符 (door descriptor) , MERITA M eI] 
(door) 。 


设置 参数 和 指向 结果 的 指针 

11~18 arg 参 数 含 有 一 个 指向 参数 的 指针 和 一 个 指 回 结果 的 指针 。 
data_ptr 指 向 参数 的 第 一 个 字 节 ，data_size 指 定 参 数 的 字 节 数 。desc_ptr 
和 desc_num 人 处理 描述 符 的 传递 ， 我 们 将 在 15.8 节 中 讲述 。rbuf 指 问 结 
缓冲 区 的 第 一 个 字 节 ，rsize 是 它 的 大 小 。 

调用 服务 器 过 程 并 输出 结果 

19~21 通过 调用 door_call 来 调用 服务 器 过 程 ， 作 为 参数 指定 的 是 所 
打开 的 门 摘 述 符 和 指向 所 设置 参数 结构 的 指针 。 调 用 返回 后 输出 结果 。 

图 15-3 给 出 了 服务 器 程序 。 它 由 一 个 名 为 servproc 的 服务 器 过 程 和 
一 个 main 函 数 构成 。 

服务 器 过 程 

2 一 10 调用 服务 器 过 程 需 有 5 个 参数 ， 但 是 我 们 真正 使 用 的 是 
dataptr， 它 指向 参数 的 第 一 个 字 节 。 通 过 该 指针 取出 长 整数 参数 后 求 它 
的 平方 。 然 后 控制 随 结果 由 door_return 传 递 回 客户 。 该 函数 的 第 一 个 参 
数 是 指向 结果 的 指针 ， 第 二 个 参数 是 结果 的 大 小 ， 其 余 两 个 参数 处 理 质 
述 符 的 返回 。 





doors/serverl.c 





1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 
4 door desc t *descptr, size t ndesc) 

5 { 

6 long arg, result; 

7 arg = *((long *) dataptr) ; 

8 result = arg * arg; 

9 Door return((char *) &result, sizeof(result), NULL, 0); 
10 } 

11 int 

12 main(int argc, char **argv) 

13: 4 

14 int fd; 

15 if (argc != 2) 

16 err quit("usage: serverl <server-pathname>") ; 
T7 /* create a door descriptor and attach to pathname */ 
18 fd = Door_create(servproc, NULL, 0); 

19 unlink (argv[1]); 

20 Close (Open (argv [1], O CREAT | O_RDWR, FILE MODE)); 
21 Fattach(fd, argv[11); 

22 /* servproc() handles all client requests */ 
23 for ( 7 5) 

24 pause () ; 

25 } 


doors/server l.c 





图 15-3 返回 一 个 长 整数 的 平方 值 的 服务 器 程序 

创建 一 个 门 描述 符 并 附 接 到 路 径 名 

17—21 调用 door_create 创 建 一 个 门 描述 符 。 该 函数 的 第 一 个 参数 是 
指向 与 该 门 关联 的 服务 器 函数 〈servproc) 的 指针 。 取 得 门 描述 符 后 ， 
必须 将 它 与 文件 系统 中 的 一 个 路 径 名 关联 ， 因 为 该 路 径 名 是 客户 标识 这 
个 门 的 手段 。 这 种 关联 通过 在 文件 系统 中 创建 一 个 普通 文件 (我 们 首先 
调用 unlink 以 防 该 文件 已 存在 ， 同 时 忽略 它 的 任何 出 错 返 回 ) 后 调用 
fattach 完 成 ， 其 中 fattach 是 把 一 个 摘 述 符 与 一 个 路 径 名 相关 联 的 SVR4 函 
数 。 

主 服务 器 线程 不 干 活 

22—24 主 服务 器 线程 然后 阻塞 在 一 个 pause 调 用 中 。 所 有 工作 全 由 
servVproc 函 数 去 做 ， 每 次 有 一 个 客户 请 求 到 达 时 ， 该 函数 就 作为 服务 器 








进程 中 的 另 一 个 线程 来 执行 。 

为 运行 这 个 客户 和 服务 堪 程 序 ， 我 们 首先 在 一 个 衫 口中 局 动 服务 
[T 

solaris 96 server1 /tmp/server1 

然后 在 另 一 个 窗口 中 局 动 客 户 ， 所 指定 的 路 径 名 参数 与 我 们 传递 给 
服务 器 的 相同 : 


solaris % client1 /tmp/server1 9 





result: 81 

solaris % ls -l /tmp/server1 

Drw-r--r--  1rstevens other1 0 Apr 9 10:09 /tmp/server1 

结果 与 预期 的 一 致 ， 当 执行 ls 时 ， 我 们 看 到 其 输出 中 第 一 个 字符 为 
D， 表 明 路 径 名 /tmp/server1 是 某 个 门 的 路 径 名 。 

图 15-4 展 示 了 本 例子 表现 的 行为 过 程 。 它 看 起 来 是 door_call 调 用 了 
服务 嚣 过程， 服务器 过 程 然 后 返回 。 





服务 器 
servproc( ) 
{ 







/* do whatever */ 
door_return( ); 





过 程 调用 









main( ) 


{ 












main( ) 
{ 





返回 





fd = open(path, ); 
door_call(fd, ); 





fd = door create( ); 
fattach(fd, path); 











图 15-4 从 一 个 进程 到 另 一 个 进程 的 表象 过 程 调 用 








图 15-5 展 示 了 调用 同一 台 主 机 上 男 一 个 进程 中 的 茶 个 过 程 时 真正 发 
生 的 行为 。 


main( ) 


{ 


1 fd = open(path, ); 
door_call(fd, ); 


door_call( ) 


{ 
6 2 











图 15-5 从 一 个 进程 到 另 





门 函数 库 














名 。 





服务 器 

servproc( ) 
{ 

/* do whatever */ 

door return( ); 4 
) 
main( ) 
( 


0 


fd = door create( ); 
fattach(fd, path); 


door create() 
( 
) 
door return() 


























个 进程 的 过 程 调用 的 真正 控制 流 

图 15-5 中 发 生 了 以 下 几 个 编 了 号 的 步骤 。 

(0) 服 务 器 进程 首先 启动 ， 它 调用 door_create 创 建 一 个 指 代 函数 
servproc 的 门 描述 符 ， 然 后 把 该 描述 符 附 接 到 文件 系统 中 的 某 个 路 径 


























(1) 客 户 进程 启动 ， 它 调用 door_call。 这 实际 上 是 门 函 数 库 中 的 一 个 


PR 





(2)door_call 库 函数 执行 一 个 进入 内 核 的 系统 调用 。 标 识 出 目标 过 程 
后 ， 控 制 被 传递 到 目标 进程 中 的 某 个 门 库 函 数 。 

(3) 真 正 的 服务 喜 过 程 〈 本 例子 中 名 为 servproc) 被 调用 。 

(4) 服 务 器 过 程 执行 处 理 客 户 请 求 押 需 的 任意 操作 ， 执 行 完 后 调用 


door return. 





(5)door_returm 实 际 上 是 门 函 数 库 中 的 一 个 函数 ， 它 执行 一 个 进入 内 


核 的 系统 调用 。 

(6) 标 识 出 客户 后 把 控制 传递 回 该 客户 。 

本 章 其 余 各 节 更 为 详尽 地 讲述 门 API， 同 时 查看 许多 例子 。 在 附录 
A 中 我 们 将 看 到 ， 就 延迟 而 言 ， 门 提供 了 最 快 的 IPC 形 式 。 


15.2 door call P| 2 


door calle Zi EH 2/7 8H]. E SUA H EAR s XE A IE = [8] FH 
行 的 一 个 服务 器 过 程 。 

#include <door.h> 

int door_call(int fd,door_arg_t *argp); 

返回 : ARIO, ARENA- 

其 中 摘 述 符 fd 通 常 是 由 open 返 回 的 《例如 图 15-2〉。 由 客户 打开 并 
将 所 返回 的 描述 符 作 为 第 一 个 参数 传递 给 door_call 的 路 径 名 标识 了 该 函 
数 所 调用 的 服务 器 过 程 。 

第 二 个 参数 argp 指 向 一 个 结构 ， 该 结构 描述 了 调用 参数 和 用 于 容纳 
返回 值 的 缓冲 区 。 

typedef struct door_arg { 








char *data_ptr; /* call: ptr to data arguments; 
return: ptr to data results */ 

size_t data_size; /* call: #bytes of data arguments; 
return: actual #bytes of data results */ 

door desc t *desc ptr; /* call: ptr to descriptor arguments; 
return: ptr to descriptor results */ 

size t desc num; /* cal: number of descriptor 

arguments; 


return: number of descriptor results */ 


char *rbuf; /* ptr to result buffer */ 
size_t rsize; /* #bytes of result buffer */ 

} door arg t; 

iR [BIS] t. p iR ES da IB EL. WAZ REY PR OS V. o CER I] FJ ES 
AREA Ze, ENS Eaves 

给 其 中 的 两 个 指针 成 员 使 用 char* 数 据 类 型 有 些 奇怪 ， 为 避免 出 现 
编译 警告 ， 我 们 不 得 不 在 代码 中 显 式 地 对 它们 进行 类 型 强制 转换 。 我 们 
倒 希 望 它们 是 void* 数 据 类 型 的 指针 。door_return 的 第 一 个 参数 也 同样 使 
用 了 char*。Solaris 2.7 也 许 会 把 desc_num 的 数据 类 型 改 为 unsigned int, 
door_return 的 最 后 一 个 参数 也 将 相应 地 作 修 改 。 

无 论 是 参数 还 是 结果 都 存在 两 种 数据 类 型 : 数据 和 描述 符 。 

数据 参数 (data arguments) 是 由 data_ptr 指 回 的 一 系列 总 共 data_size 
个 字 节 。 客 户 和 服务 器 必须 以 某 种 方式 “知道 ?这 些 参数 〈 以 及 结 采 ) 的 
格式 。 举 例 来 说 ， 无 法 通过 特殊 的 编码 告诉 服务 器 参数 的 数据 类 型 。 在 
图 15-2 和 图 15-3 中 ， 客 户 程 友和 服务 器 程序 编写 成 知道 参数 是 一 个 长 整 
数 ， 结 果 也 是 一 个 长 整数 。 封 装 数据 类 型 信息 的 办 法 之 一 是 (为 了 帮 干 
年 后 有 人 仍 能 读 异 代码 ) : 把 所 有 的 参数 放 进 一 个 结构 中 ， 把 所 有 的 结 
条 放 进 另 一 个 结构 中 ， 把 这 两 个 结构 都 定义 在 一 个 头 文 件 中 ， 客 户 程 序 
和 服务 喜 程 序 都 包括 进 这 个 头 文件 。 我 们 将 随 图 15-11 和 图 15-12 给 出 一 
个 这 样 的 例子 。 如 果 没 有 数据 参数 ， 我 们 就 把 data_ptr 指 定 成 一 个 空 指 
针 ， 把 data_size 指 定 为 0。 

由 于 客户 和 服务 嫩 处 理 的 是 封装 到 一 个 参数 缓冲 区 和 一 个 结 打 缓冲 
区 中 的 二 进 制 参数 和 结果 ， 因 而 隐 含 痢 客 户 程序 和 服务 器 程序 必须 以 同 
样 的 编译 器 编译 的 要 求 。 有 时 候 在 同样 的 系统 上 ， 不 同 的 编译 器 也 会 以 
不 同 的 方式 封装 结构 。 

描述 符 参 数 (descriptor arguments) 是 一 个 door_desc_t 结 构 的 数 
组 ， 每 个 元 素 含 有 一 个 从 客户 往 服务 器 过 程 传递 的 描述 符 。 所 传递 的 














door desc t 结 构 数 为 desc_num。 《〈 我 们 将 在 15.8 节 描述 这 个 结构 以 及 “ 传 
递 描述 符 ” 的 含义 。) 如 果 没 有 描述 符 参 数 ， 我 们 就 把 desc_ptr 指 定 成 一 
个 空 指针 ， 把 desc_num 指 定 为 0。 

返回 时 data_ptr 指 向 数据 结果 (data results) ，data_size 则 指定 这 些 
结果 的 大 小 。 如 果 没 有 数据 结果 ，data_size 就 为 0， 这 时 我 们 应 该 忽略 
data_ptr。 

返回 时 也 可 能 有 描述 符 结果 (descriptor results) : desc_ptr 指 向 一 
个 door_desc_t 结 构 的 数组 ， 每 个 元 了 素 含有 一 个 由 服务 器 过 程 传递 回 客户 
的 摘 述 符 。 所 返回 的 door_desc t 绪 构 数 存 放 在 desc_num 中 。 如 果 没 有 摘 
述 符 结 果 ，desc_num 就 为 0， 这 时 我 们 应 该 忽略 desc_ptr。 

给 参数 和 结果 使 用 同样 的 缓冲 区 是 可 行 的 。 这 就 是 说 调用 door_call 
时 ，data_ptr 和 desc_ptr 都 可 指 同 由 rbuf 指 定 的 缓冲 区 中 。 

在 调用 door_call 前 ， 客 户 把 rbuf 设 置 成 指 问 存 放 结 果 的 缓冲 区 ， 把 
rsize 设 置 成 该 缓冲 区 的 大 小 。 返 回 时 data_ptr 和 desc_ptr 通 常 都 指向 这 个 
结果 缓冲 区 中 。 如 果 该 缓冲 区 太 小 而 容纳 不 了 服务 器 的 结果 ， 门 函数 库 
就 会 在 调用 者 的 地 址 空间 中 使 用 mmap (12.245) 自动 分 配 一 个 新 的 组 
冲 区 ， 然 后 相应 地 更 新 Tbuf 和 rsize。data_ptr 和 desc_ptr 将 指向 这 个 新 分 
配 的 缓冲 区 中 。 留 意 rbuf 的 变化 并 在 以 后 某 个 时 刻 以 rbuf 和 rsize 为 参数 
调用 munmap 把 门 函 数 库 分 配 的 缓冲 区 返还 给 系统 ， 这 些 是 调用 者 的 贡 
任 。 我 们 将 随 图 15-7 给 出 这 样 的 一 个 例子 。 


15.3 door create? 2% 


服务 器 进程 通过 调用 door_create 建 立 一 个 服务 器 过 程 。 


#include <door.h> 








typedef void Door_server_proc(void *cookie,char  *dataptr,size t 


datasize, 


door_desc_t *descptr,size_t ndesc); 
int door_create(Door_server_proc *proc,void *cookie,u_int attr); 
返回 : Ae MASE RIA, A EtA- 

在 上 述 的 声明 中 ， 我 们 加 上 了 自己 的 typedef， 这 样 简 化 了 服务 器 过 
程 的 函数 原型 。 这 个 typedef 语 句 说 ， 门 服务 器 过 程 〈 例 如 图 15-3 中 的 
servproc) 是 以 5 个 参数 调用 的 ， 不 返回 任何 值 。 

当 一 个 服务 器 调用 door_create 时 ， 传 递 给 该 函数 的 第 一 个 参数 proc 
是 一 个 服务 器 过 程 的 地 址 ， 该 服务 器 过 程 将 与 由 该 函数 返回 的 门 描述 符 
相关 联 。 当 调用 这 个 服务 器 过 程 时 ， 它 的 第 一 个 参数 cookie 是 作为 
door_create 的 第 二 个 参数 传递 进去 的 值 。 这 么 一 来 给 服务 器 提供 了 癌 服 
务 嚣 过程 传递 某 个 指针 的 一 种 方式 ， 该 指针 在 每 次 有 一 个 客户 调用 该 过 
程 时 传递 。 服 务 嚣 过程 的 以 后 4 个 参数 (dataptr、datasize、descptr、 
ndesc) 描述 来 自 服 务 器 的 数据 参数 和 描述 符 参 数 ， 也 就 是 上 一 节 中 描 
述 的 door_arg_t 结 构 的 前 4 个 成 员 所 描述 的 信息 。 

door_create 的 最 后 一 个 参数 attr 描 述 所 创建 服务 器 过 程 的 特殊 属性 ， 
它 或 为 0， 或 为 以 下 两 个 常 值 的 按 位 或 。 

DOOR_PRIVATE 随 着 客户 请 求 的 到 达 ， 门 函数 库 在 服务 器 进程 中 
自动 创建 必要 的 新 线程 以 调用 服务 器 过 程 。 按 照 默认 设置 ， 这 些 线程 放 
在 进程 范围 的 线程 池 中 ， 可 用 于 给 服务 器 进程 中 的 任何 门 提供 客户 请 求 
的 服务 。 指 定 DOOR_PRIVATE 属 性 就 是 告诉 门 函数 库 该 门 得 有 自己 的 
服务 器 线程 池 ， 与 进程 范围 的 池 分 开 。 

DOOR UNREF 当 指 代 该 门 的 描述 符 数 从 2 降 为 1 时 ， 将 第 二 个 参数 

(dataptr) 指定 为 DOOR_UNREF_DATA 再 次 调用 该 服务 器 过 程 。 这 次 

调用 的 descptr 参 数 是 一 个 空 指针 ，datasize 和 ndesc 则 均 为 0。 我 们 将 从 图 
15-16 的 讨论 开始 给 出 这 个 属性 的 一 些 例子 。 

服务 占 过 程 的 返回 值 声明 为 void， 因 为 它们 从 不 通过 调用 return 或 挥 
出 函数 尾 返 回 。 它 们 会 调用 我 们 将 在 下 一 节 描 述 的 door_return。 




















我 们 从 图 15-3 中 已 看 到 ， 调 用 door_create 获 取 一 个 门 描述 符 之 后 ， 
服务 器 通常 调用 fattach 给 该 描述 符 关 联 以 一 个 文件 系统 中 的 路 径 名 。 客 
户 open 访 路径 名 就 获得 了 调用 door_call 所 需 的 门 描述 符 。 

fattach 不 是 一 个 Posix.1 函 数 ， 但 是 Unix 98 却 需要 它 。 另 外 ， 有 一 个 
名 为 fdetach 的 函数 撤销 这 种 关联 ， 名 为 fdetach 的 命令 则 简单 地 激活 该 同 
名 函数 。 

由 door_create 创 建 的 门 描述 符 在 其 文件 摘 述 符 标 志 中 设置 了 
FD_CLOEXEC 人 位。 这 意味 着 创建 一 个 门 描述 符 的 进程 如 果 调 用 了 任意 
一 个 exec 国 数 ， 该 描述 符 就 被 内 核 和 关闭。 至 于 fork， 尽 管 父 进程 中 已 打 
开 的 所 有 描述 符 随 后 为 子 进程 所 共享 ， 却 只 有 父 进程 会 收 到 来 自 客 户 的 
门 激活 请 求 ， 这 些 请 求 不 会 递交 给 子 进程 ， 即 使 由 door_create 返 回 的 摘 
述 符 在 子 进程 中 也 是 打开 的 。 

如 果 我 们 把 一 个 门 考虑 成 是 由 一 个 进程 ID 和 竺 调用 的 相应 服务 器 过 
程 的 地 址 标识 的 《我 们 将 从 在 15.6 节 介绍 的 door_info _t 结 构 中 看 到 这 两 
个 标识 信息 ) ， 那 么 关于 fork 和 exec 的 这 两 条 规则 就 有 意义 了 。 子 进程 
永远 得 不 到 门 激活 请 求 是 因为 与 该 门 关 联 的 进程 ID 是 调用 door_create 的 
父 进程 的 进程 ID。 遇 到 exec 调 用 时 门 描述 符 必 须 关 闭 的 原因 则 在 于 ， 即 
使 进程 ID 没有 改变 ， 与 该 门 关联 的 服务 器 过 程 的 地 址 在 exec 之 后 新 激活 
的 程序 申 已 失去 意义 ， 








15.4 door return 函数 


服务 器 过 程 完 成 工作 时 通过 调用 door_return 返 回 。 这 会 使 客户 中 相 
关联 的 door_call 调 用 返回 。 

#include <door.h> 

int door_return(char *dataptr,size_t datasize,door_desc_t *descptr,size_t 


*ndesc); 





返回 : 大 成 功 则 不 返回 若 出 错 则 为 -1 
数据 结果 由 dataptr 和 datasize 指 定 ， 描 述 符 结果 由 descptr 和 ndesc 指 


15.5 door _credpk ZA 


LN LM 服务 器 过 程 能 够 获取 每 个 调用 对 应 的 客户 
和 凭证。 这 是 由 door_cred 函 数 完成 的 。 


#include <door.h> 





int door_cred(door_cred_t *cred); 
返回 : AMMA, ABENA- 
其 中 由 cred 指 回 的 door_cred_t 结 构 将 在 返回 时 填 入 客户 的 赁 
typedef struct door_cred { 
uid_tdc_euid; /* effective user ID of client */ 
gid_tdc_egid; /* effective group ID of client */ 
uid_tdc_ruid; /* real user ID of client */ 
gid_tdc_rgid; /* real group ID of client */ 
pid_tdc_pid; /* process ID of client */ 
} door. cred t; 
APUE 的 4.4 节 讨论 了 有 效 ID 和 实际 ID 之 间 的 差别 ， 我 们 将 随 图 15-8 
给 出 体现 这 种 差异 的 一 个 例子 。 
注意 本 函数 中 没有 描述 符 参 数 。 本 函数 返回 发 起 当前 门 激活 请 求 的 
客户 的 有 关 信 息 ， 因 而 必须 在 服务 器 过 程 或 由 该 过 程 调 用 的 某 个 函数 中 
调用 它 。 


15.6 door info pK 2 
我 们 刚才 捅 述 的 door_cred 函 数 给 服务 器 提供 关于 客户 的 信息 。 客 户 





也 可 通过 调用 door_info 函 数 找 出 有 关 服 务 器 的 信息 。 
#include <door.h> 
int door_info(int fd,door_info_t *info); 
返回 : AMM AO, Æ hEN- 
其 中 fd 指定 一 个 已 打开 的 门 。 由 info 指 向 的 door_info_t 结 构 将 在 返回 
时 填 入 关于 服务 右 的 信息 。 
typedef struct door_info { 


pid_t di_target; /* server process ID */ 

door ptr t di proc; /* server procedure */ 

door ptr t di data; /* cookie for server procedure */ 
door attr t di attributes; /* attributes associated with door */ 
door id t di uniquifier; /* unique number */ 


} door info t; 

其 中 di _target 是 服务 器 的 进程 ID，di_proc 是 所 指定 的 服务 器 过 程 在 
服务 器 进程 中 的 地 址 〈 对 于 客户 来 说 ， 这 个 地 址 信息 也 许 没 什么 用 ) 。 
作为 第 一 个 参数 传递 给 该 服务 器 过 程 的 cookie 指 针 由 di _data 返 回 。 

该 门 的 当前 属性 存放 在 di_attributes 中 ， 我 们 已 在 15.3 节 中 描述 过 两 
个 属性 : DOOR_PRIVATE 和 DOOR_UNREF。 两 个 新 属性 是 
DOOR LOCAL (该 过 程 局 部 于 本 进程 》 和 DOOR_REVOKE 《服务 器 
已 通过 调用 door_ revoke 函 数 撤销 了 与 该 门 关联 的 过 程 ) 。 

每 个 门 刚 被 创建 时 都 被 赋予 一 个 系统 范围 内 唯一 的 数值 ， 它 作为 
di_uniquifieri [4] . 

本 函数 通常 由 客户 调用 ， 以 获取 关于 服务 器 的 信息 。 然 而 它 也 可 以 
由 一 个 服务 器 过 程 调用 ， 这 时 第 一 个 参数 指定 为 DOOR_QUERY， 上 所 返 
回 的 信息 是 关于 调用 线程 的 。 这 种 情形 下 ， 服 务 器 过 程 的 地 址 

(di proc) 和 cookie Cdi data? 也 许 有 用 。 





15.7 例子 


现在 给 出 使 用 之 前 所 述 五 个 函数 的 一 些 例 子 。 

15.7.1 door. info 函 数 

图 15-6 给 出 的 程序 打开 一 个 门 ， 调 用 door_ info， 然 后 输出 关于 该 门 
的 信息 。 





1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fd; 

6 struct stat stat; 

7 struct door infoinfo; 

8 if (argc != 2) 

9 err quit("usage: doorinfo «pathname»"); 
10 fd - Open(argv[1], O RDONLY); 

TT Fstat(fd, &stat); 

12 if (S ISDOOR(stat.st mode) == 0) 

13 err quit("pathname is not a door"); 

14 Door info(fd, &info); 

15 printf ("server PID = %ld, uniquifier = $1d", 
16 (long) info.di target, (long) info.di uniquifier); 
17 if (info.di attributes & DOOR LOCAL) 

18 printf(", DOOR LOCAL"); 

19 if (info.di attributes & DOOR PRIVATE) 

20 printf(", DOOR PRIVATE"); 

21 if (info.di attributes & DOOR REVOKED) 

22 printf(", DOOR REVOKED"); 

23 if (info.di attributes & DOOR UNREF) 

24 printf(", DOOR UNREF"); 

25 printf ("Mn"); 

26 exit(0); 

27 ^y 





图 15-6 输出 关于 一 个 门 的 信息 


doors/doorinfo.c 


doors/doorinfo.c 


我 们 open 所 指定 的 路 径 名 并 首先 验证 它 是 一 个 门 。 对 应 一 个 门 的 
stat 结 构 的 st_mode 成 员 含 有 一 个 值 ， 该 值 使 得 9_ISDOOR 宏 求 值 为 真 。 





我 们 接着 调用 door_info。 





我 们 首先 指定 一 个 不 是 门 的 路 径 名 运行 该 程序 ， 然 


2.6 所 用 的 两 个 门 运行 它 。 
solaris % doorinfo /etc/passwd 
pathname is not a door 


solaris 96 doorinfo /etc/.name service door 


后 针对 Solaris 


server PID = 308,uniquifier = 18,DOOR, UNREF solaris % doorinfo 


/etc/.syslog_door 


server PID = 282,uniquifier = 1635 
solaris % ps -f -p 308 


root 308 1 0 Apr01? 0:34 /usr/sbin/nscd 
solaris 96 ps -f -p 282 
root 282 1 0 Apr01? 0:10 /usr/sbin/syslogd - 
n -z 14 





我 们 使 用 ps 命令 来 查看 以 由 door_info 返 回 的 进程 ID 运行 的 是 什么 程 
Fre 

15.7.2 结果 缓冲 区 大 小 

在 描述 door_call 函 数 时 我 们 提 到 过 ， 如 果 结 果 缓 冲 区 太 小 而 容纳 不 
了 服务 器 的 结果 ， 门 函数 库 就 会 自动 分 配 一 个 新 的 缓冲 区 。 我 们 现在 给 
出 展示 这 一 特性 的 一 个 例子 。 图 15-7 给 出 了 新 的 客户 程序 ， 它 是 对 图 15- 
2 的 简单 修改 。 








doors/client2.c 





1 #include "unpipc.h" 


2 Ant 
3 main(int argc, char **argv) 


4 { 


5 int fd; 

6 long ival, oval; 

7 door arg t arg; 

8 LE (afgc 12 3) 

9 err quit("usage: client2 «server-pathname» <integer-value>") ; 
10 fd - Open(argv[1], O RDWR); /* open the door */ 

T4 /* set up the arguments and pointer to result */ 

12 ival = atol(argv[2]); 

13 arg.data_ptr = (char *) &ival;/* data arguments */ 

14 arg.data_size = sizeof(long); /* size of data arguments */ 
is arg.desc ptr = NULL; 

16 arg.desc_num = 0; 

T arg.rbuf - (char *) &oval; /* data results */ 

18 arg.rsize = sizeof (long); /* size of data results */ 
19 /* call server procedure and print result */ 

20 Door call(fd, &arg); 

21 printf("&oval = $p, data ptr = $p, rbuf = $p, rsize = %d\n", 
22 &oval, arg.data ptr, arg.rbuf, arg.rsize); 

23 printf("result: $1dWMn", *((long *) arg.data ptr)); 

24 exit (0); 

25 ) 


doors/client2.c 
图 15-7 输出 结果 的 地 址 

19—23 ”在 这 个 版 本 的 程序 中 ， 我 们 输出 oval 变 量 的 地 址 、data_ptr 

的 内 容 ( 它 指 辣 从 door_call 返 回 的 结果 〉 以 及 结果 绥 冲 区 的 地 址 和 大 小 
(rbuffllrsize) 。 

这 时 运行 该 程序 ， 我 们 还 没有 修改 来 自 图 15-2 的 结果 缓冲 区 的 大 
小 ， 因 此 预期 data_ptr 和 rbuf 都 指向 oval 变 量 ，rsize 则 为 4 字 节 。 确 实 ， 这 
跟 我 们 实际 看 到 的 一 致 : 

solaris % client2 /tmp/server2 22 

&oval = effff740,data_ptr =effff740,rbuf = effff740,rsize = 4 

result: 484 

PEJA Cy 15-749 47, FEA PIER RE KD RZD ES . 
新 版 本 中 将 图 15-7 的 第 18 行 改 为 如 下 : 


arg.rsize = sizeof(long)- 1; /* size of data results */ 

执行 这 个 新 的 客户 程序 ， 我 们 看 到 分 配 了 一 个 新 缓冲 区 ，data_ptr 
惑 指 癌 这 个 新 缓冲 区 。 

solaris % client3 /tmp/server3 33 

&oval = effff740,data_ptr =ef620000,rbuf = ef620000,rsize = 4096 

result: 1089 

所 分 配 缓冲 区 的 大 小 4096 是 该 系统 上 的 页 面 大 小 ， 我 们 已 在 12.6 节 
中 看 到 过 这 个 大 小 。 从 这 个 例子 可 以 看 出 ， 我 们 应 该 总 是 通过 data_ptr 

虽 针 访问 服务 器 的 结 有 末 ， 而 不 能 通过 其 地 址 在 rbuf 中 传递 给 服务 器 的 变 

量 。 这 就 是 说 在 我 们 的 例子 中 ， 我 们 应 该 以 *((long*)arg.data_ptn) 访 问 长 
整数 结果 ， 而 不 是 以 oval 来 访问 《图 15-2 中 是 这 么 做 的 ) 。 

通过 调用 mmap 分 配 的 这 个 新 绥 冲 区 可 使 用 munmap 返 还 给 系统 。 窜 
户 也 可 以 给 后 续 的 door_call 调 用 一 直 使 用 该 缓冲 区 。 

15.7.3 door. credi ZIURI ZR: P? 55 uE 

这 一 次 我 们 对 图 15-3 中 的 servproc 函 数 做 了 修改 : Vi Hidoor credrf 
数 来 获取 客户 的 凭证 。 图 15-8 给 出 了 这 个 新 的 服务 絮 过 程 ， 客 户 和 服务 
器 main 函 数 不 变 ， 仍 然 是 图 15-2 和 图 15-3。 








doors/server4.c 





1 #include "unpipc.h" 


2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
door desc t *descptr, size t ndesc) 


S 


5 1 

6 long arg, result; 

7 door cred t info; 

8 /* obtain and print client credentials */ 

9 Door cred(&info); 

10 printf ("euid = $1d, ruid = $1d, pid = %ld\n", 

ll (long) info.dc euid, (long) info.dc ruid, (long) info.dc_pid) ; 
12 arg - *((long *) dataptr); 

13 result - arg * arg; 

14 Door return((char *) &result, sizeof(result), NULL, 0); 


doors/server4.c 





图 15-8 获取 并 输出 客户 凭证 的 服务 器 过 程 
首先 运行 客户 程序 ， 正 如 所 料 ， 我 们 将 看 到 有 效用 户 ID 等 于 实际 用 
户 ID。 接 着 变换 为 超级 用 户 ， 把 客户 程序 可 执行 文件 的 属 主 改 为 root， 
并 启用 该 文件 的 SUID 位 ， 然 后 再 次 运行 客户 程序 。 [2] 





solaris % client4 /tmp/server4 77 第 一 次 运行 客户 程序 
result: 5929 

solaris % su 变 为 超级 用 户 
Password: 

Sun Microsystems Inc. SunOS 5.6 Generic August 1997 





solaris # cd 含有 客户 程序 可 执行 文件 的 目录 
solaris # ls -l client4 


-rwxrwxr-x 1 rstevens other1 139328 Apr 13 06:02 client4 


solaris # chown root client4 把 属 主 改 为 root 
solaris # chmod u+s client4 并 打开 SUID 位 
solaris # Is -l client4 分 查 文件 权限 与 属 主 
-TWSIWXI-X 1 root other1 139328 Apr 13 06:02 client4 


solaris # exit 

solaris % ls -l client4 

-rwsrwxr-x 1 root other1 139328 Apr 13 06:02 client4 

solaris % client4 /tmp/server4 77 然后 再 次 运行 客户 程序 

result: 5929 

查看 服务 颖 的 输出 ， 我 们 看 到 第 二 次 运行 客户 程序 时 ， 有 效用 户 ID 
RET EM 

solaris % server4 /tmp/server4 

euid = 224,ruid = 224,pid = 3168 

euid = 0,ruid = 224,pid =3176 

其 中 有 效用 户 ID 为 0 表示 超级 用 户 。 


15.7.4 服务 器 的 自动 线程 管理 

为 了 查看 由 服务 器 执行 的 线程 管理 ， 我 们 让 服务 器 过 程 在 一 开始 执 
行 时 输出 自己 所 在 线程 的 线程 ID， 然 后 让 它 睡眠 5 秒 ， 以 此 模拟 一 个 运 
行 时 间 较 长 的 服务 器 过 程 。 这 段 睡眠 使 我 们 可 以 在 已 有 一 个 客户 正在 接 
受 服 务 期 间 启 动 多 个 客户 。 图 15-9 给 出 了 新 的 服务 器 过 程 。 





doors/server5.c 





1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

51 

6 long arg, result; 

7 arg - *((long *) dataptr); 

8 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
9 sleep(5); 

10 result - arg * arg; 

11 Door return((char *) &result, sizeof(result), NULL, 0); 
12 i 


doors/server5.c 

















图 15-9 输出 线程 ID 后 睡眠 的 服务 器 过 程 


其 中 引入 了 来 自我 们 自己 的 函数 库 的 一 个 新 函数 pr_thread_id。 它 需 
要 一 个 参数 (指向 一 个 线程 ID 的 指针 或 表示 使 用 调用 线程 之 线程 I 有 D 的 空 
BET) ， 返 回 的 是 该 线程 的 一 个 long 类 型 的 整数 标识 符 〔 往 往 是 一 个 小 
整数 ) 。 一 个 进程 总 是 可 以 由 一 个 整数 值 来 标识 ， 这 个 整数 就 是 它 的 进 
程 ID。 即 使 我 们 不 清楚 进程 ID 是 int 类 型 还 是 long 类 型 ， 也 只 需 把 getpid 
的 返回 值 类 型 强制 转换 成 long 类 型 后 输出 其 值 〈 图 9-2) 。 但 是 线程 的 标 
识 符 是 一 个 pthread ft 数据 类 型 的 值 〈 称 为 线程 ID) ， 它 不 必 是 一 个 整 
数 。 事 实 上 ，Solaris 2.6 使 用 小 整数 作为 线程 ID，Digital Unix 则 使 用 指 
针 。 然 而 我 们 往往 希望 只 给 线程 输出 一 个 小 整数 标识 符 〈 本 例子 就 是 这 
样 ) ， 以 用 于 调试 目的 。 图 15-10 给 出 的 pr thread _id 库 函数 可 处 理 这 个 


问题 。 























lib/wrappthread.c 


245 long 

246 pr_thread_id(pthread_t *ptr) 

247 { 

248 #if defined (sun) 

249 return((ptr == NULL) ? pthread self() : *ptr); /* Solaris */ 


250 #elif defined(__osf__) && defined( alpha) 
251 pthread t tid; 


252 tid - (ptr -- NULL) ? pthread self() : *ptr; /* Digital Unix */ 
253 return(pthread getsequence np(tid)); 

254 #else 

255 /* everything else */ 

256 return((ptr -- NULL) ? pthread self() : *ptr); 

257 #endif 

258 ) 


lib/wrappthread.c 





图 15-10 pr thread idi Zik: 给 调用 线程 返回 小 整数 标识 符 

如 果实 现 没有 给 线程 提供 小 整数 标识 符 ， 这 个 函数 丈 可 能 复杂 得 
多 ， 需 要 把 pthread t 值 映射 成 小 整数 ， 并 记 住 这 种 映射 天 系 〈 存 放 在 一 
个 数组 或 链表 中 ) ， 供 以 后 的 调用 使 用 。 [Lewis and Berg 1998] 中 的 
thread_name rh Zitzà x, f 3x4 LF « 

返回 图 15-9， 我 们 接连 运行 客户 程序 三 次 。 由 于 我 们 在 局 动 下 一 个 
客户 之 前 等 待 shell 提 示 符 ， 因 此 知道 每 次 在 服务 器 端的 5 秒 钟 等 待 都 是 
完整 的 。 

solaris 96 client5 /tmp/server5 55 

result: 3025 

solaris 96 client5 /tmp/server5 66 

result: 4356 

solaris 96 client5 /tmp/server5 77 

result: 5929 

得 看 服务 器 的 输出 ， 我 们 看 到 同一 个 服务 器 线程 为 每 个 客户 提供 服 


solaris 96 server5 /tmp/server5 
thread id 4,arg = 55 


thread id 4,arg = 66 
thread id 4,arg = 77 
现在 同时 局 动 三 个 客户 : 
solaris 96 client5 /tmp/server5 11 & client5 /tmp/server5 22 & \ 
client5 /tmp/server5 33 & 
[2] 3812 
[3] 3813 
[4] 3814 
solaris96 result: 484 
result: 121 
result: 1089 
服务 器 的 输出 表明 ， 服 务 器 进程 创建 了 两 个 新 线程 来 处 理 同 一 个 服 
务 器 过程 的 第 二 次 和 第 三 次 激活 请 求 。 
thread id 4,arg = 22 
thread id 5,arg = 11 
thread id 6,arg = 33 
接着 同时 启动 另外 两 个 客户 : 
solaris 96 client5 /tmp/server5 11 & client5 /tmp/server5 22 & 
[2] 3830 
[3] 3831 
solaris96 result: 484 
result: 121 
我 们 看 到 服务 器 使 用 的 是 以 前 创建 的 线程 : 
thread id 6,arg = 22 
hread id 5,arg = 11 
从 本 例子 可 以 看 出 ， 服 务 器 进程 (实际 上 是 跟 我 们 的 服务 器 代码 相 
链接 的 门 函 数 库 ) 根据 需要 目 动 创建 服务 器 线程 。 如 打 一 个 应 用 程序 希 





望 杀 自 处 理 线程 的 管理 ， 那 么 它 可 以 使 用 我 们 将 在 15.9 节 中 描述 的 函数 
去 这 么 做 。 

我 们 还 验证 了 服务 器 过 程 是 一 个 并 发 〈concurrent) 服务器 : 同一 
个 服务 器 过 程 同 时 可 有 多 个 实例 在 运行 ， 它 们 作为 彼此 独立 的 线程 给 不 
同 的 客户 提供 服务 。 认 定 服务 器 并 发 的 第 一 个 办 法 是 ， 当 我 们 同时 运行 
三 个 客户 时 ， 所 有 三 个 结果 都 在 5 秒 后 输出 。 要 是 服务 器 是 迭 代 的 

(iterative〉， 那 么 第 一 个 结果 在 所 有 三 个 客户 都 启动 后 过 5 秒 输出 ， 下 

一 个 结果 再 过 5 秒 输出 ， 最 后 一 个 结果 又 过 5 秒 后 才 输 出 。 

15.7.5 服务 器 的 自动 线程 管理 : 多 个 服务 器 过 程 

前 一 个 例子 的 服务 器 进程 中 只 有 一 个 服务 器 过 程 。 我 们 的 下 一 个 问 
题 是 ， 同 一 服务 器 进程 中 的 多 个 服务 器 过 程 是 否 可 以 使 用 同一 个 线程 
池 。 为 测试 这 一 点 ， 我 们 给 服务 器 进程 增加 了 男 一 个 服务 嚣 过程， 同时 
重新 编写 了 前 一 个 例子 的 代码 ， 以 表现 出 在 不 同 进程 间 处 理 参数 和 结果 
的 一 种 更 好 的 风格 。 

我 们 的 第 一 个 文件 是 名 为 squareproc.h 的 头 文件 ， 它 给 我 们 的 求 平 方 
函数 定义 了 一 个 输入 参数 的 数据 类 型 和 一 个 输出 参数 的 数据 类 型 。 它 还 
给 该 过 程 定义 了 路 径 名 。 图 15-11 给 出 了 该 文件 。 

















doors/squareproc.h 


1 #define PATH SQUARE DOOR "/tmp/squareproc door" 

2 typedef struct { /* input to squareproc() */ 

3 long argl; 

4 } squareproc in t; 

5 typedef struct { /* output from squareproc() */ 
6 long resl; 


7 ) squareproc out t; 
doors/squareproc.h 





图 15-11 squareproc.h3- 4#} 

我 们 的 新 服务 器 过 程 接受 一 个 长 整数 输入 值 ， 返 回 一 个 double 类 型 
的 值 ， 该 值 是 输入 值 的 平方 根 。 我 们 在 sqrtproc.h 尖 文件 中 定义 了 该 过 程 
的 路 径 名 、 输 入 结构 和 输出 结构 ， 图 15-12 给 出 了 该 文件 。 





doors/sqrtproc.h 
1 #define PATH SQRT DOOR "/tmp/sqrtproc_door" 


2 typedef struct { /* input to sqrtproc() */ 
3 long argl; 
4 } sqrtproc in t; 


5 typedef struct { /* output from sqrtproc() */ 
6 double resl; 
7 ) sqrtproc out t; 





doors/sqrtproc.h 


图 15-12 sqrtproc.h3 x: ff 
我 们 的 客户 程序 在 图 15-13 中 给 出 。 它 - 先 一 后 调用 那 两 个 服 


A dE. Med XL ART EN UE SP 他 客户 程序 类 
似 。 











doors/client7.c 


1 #include "unpipc.n" 

2 #include "squareproc.h" 

3 #include "sqrtproc.h" 

4 int 

5 main(int argc, char **argv) 

6 { 

7 int fdsquare, fdsqrt; 

8 door arg t arg; 

9 squareproc in t square in; 
10 Squareproc out t square out; 

LL sqrtproc int sqrt_in; 

12 sqrtproc out t sqrt out; 
13 if (argc != 2) 
14 err quit("usage: client7 «integer-value»"); 
15 fdsquare - Open(PATH SQUARE DOOR, O RDWR); 
16 fdsqrt - Open(PATH SQRT DOOR, O RDWR); 
17 /* set up the arguments and call squareproc() */ 
18 square in.argl = atol(argv[1])j; 

19 arg.data ptr - (char *) &square in; 

20 arg.data size - sizeof(square in); 

21 arg.desc ptr - NULL; 

22 arg.desc num = 0; 

23 arg.rbuf - (char *) &square out; 

24 arg.rsize = sizeof (square out); 

25 Door call(fdsquare, &arg) ; 

26 /* set up the arguments and call sqrtproc() */ 
27 sqrt in.argl = atol(argv[1]); 
28 arg.data_ptr = (char *) &sqrt_in; 

29 arg.data size = sizeof (sqrt_in); 

30 arg.desc_ptr = NULL; 

31 arg.desc_num = 0; 

32 arg.rbuf = (char *) &sqrt_out; 

33 arg.rsize = sizeof (sqrt out); 

34 Door call(fdsqrt, &arg) ; 

35 printf ("result: $1d %g\n", square out.resl, sqrt_out.res1) ; 
36 exit (0); 

37 } 


doors/client7.c 








图 15-13 调用 求 平方 过 程 和 求 平方 根 过 程 的 客户 程序 
图 15-14 给 出 了 我 们 的 两 个 服务 器 过 程 。 其 所 在 线程 
的 线程 ID 和 输入 参数 ， 睡 眠 5 秒 钟 ， 计 算 结 果 ， 然 后 返 
15-1525 t B 45-38 FEFF main PI ee 符 ， 然 后 给 每 


个 门 描述 符 关 联 一 个 服务 器 过 程 。 





#include "unpipc.h" 
#include <math.h> 
#include "Squareproc.h" 
#include "sqrtproc.h" 
void 
squareproc(void *cookie, char *dataptr, size_t datasize, 
door_desc_t *descptr, size_t ndesc) 
{ 
Squareproc in t in; 
Squareproc out tout; 
memcpy(&in, dataptr, min(sizeof(in), datasize)); 
printf("squareproc: thread id %ld, arg = %ld\n", 
pr thread id(NULL), in.argl); 
Sleep(5); 
out.resl - in.argl * in.argl; 
Door return((char *) &out, sizeof(out), NULL, 0); 
) 
void 
Sqrtproc(void *cookie, char *dataptr, size t datasize, 
door desc t *descptr, size t ndesc) 
{ 
Sqrtproc in t in; 
Sqrtproc out t out; 
memcpy(&in, dataptr, min(sizeof(in), datasize)); 
printf("sqrtproc: thread id $1d, arg = %ld\n", 
pr thread id(NULL), in.argl); 
sleep(5); 
out.resl = sqrt((double) in.arg1); 
Door return((char *) &out, sizeof(out), NULL, 0); 
) 


图 15-14 两 个 服务 器 过 程 


doors/server7.c 


doors/server7.c 


doors/server7.c 





31 int 


32 main(int argc, char **argv) 


33 { 


int fd; 


if' (ange; d= T) 
err quit ("usage: server7") ; 


fd = Door_create(squareproc, NULL, 0); 
unlink(PATH SQUARE DOOR); 

Close(Open(PATH SQUARE DOOR, O CREAT | O RDWR, FILE MODE)); 
Fattach(fd, PATH SQUARE DOOR); 


fd - Door create(sqrtproc, NULL, 0); 
unlink(PATH SQRT DOOR); 

Close(Open(PATH SQRT DOOR, O CREAT | O RDWR, FILE MODE)); 
Fattach(fd, PATH SQRT DOOR); 


for Ug n) 
pause () ; 


doors/server7.c 





料 ) 


图 15-15 服务 器 程序 main 函 数 








我 们 运行 客户 程序 ， 它 需 花 10 秒 钟 才 输 出 结果 《正如 我 们 的 预 


o 


solaris 96 client7 77 

result: 5929 8.77496 

碍 看 服务 器 的 输出 ， 我 们 看 到 服务 器 进程 中 同一 线程 处 理 了 该 客户 
的 先后 两 个 请 求 。 


solaris % server7 


squareproc: thread id 4,arg = 77 


sqrtproc: thread id 4,arg = 77 

这 个 例子 告诉 我 们 ， 对 于 一 个 给 定 进程 ， 其 服务 器 线程 池 中 的 任意 
线程 都 能 够 处 理 针 对 任意 服务 器 过 程 的 客户 请 求 。 

15.7.6 服务 器 的 DOOR_UNREF 属 性 

我 们 在 15.3 节 中 提 到 过 ，DOOR_UNREF 可 作为 一 个 新 创建 的 门 的 
属性 之 一 指定 给 door_create 函 数 。 该 函数 的 手册 页 面 中 说 ， 当 指 代 某 个 
具备 该 属性 的 门 的 描述 符 数 降 为 1〈 即 该 门 的 引用 计数 从 2 变 为 1) 时 ， 


该 门 的 服务 器 过 程 将 有 一 次 特殊 的 激活 。 特 殊 之 处 在 于 ， 传 递 给 该 服务 
器 过 程 的 第 二 个 参数 〈 指 癌 数据 参数 的 指针 〉 Ae ATE 
DOOR_UNREF_DATA。 下 面 列 出 了 引用 该 门 的 三 种 方法 。 

(1) 服 务 器 中 由 door_create 返 回 的 描述 符 算 作 一 个 引用 。 事 实 上 ， 激 
活 某 个 不 再 引用 过 程 的 触发 条 件 是 其 引用 计数 从 2 变 为 1 而 不 是 从 1 变 为 0 
的 原因 在 于 ， 服 务 器 进程 通常 在 其 整个 存活 期 内 一 直 保 持 该 描述 符 打 
val 

(2) 附 接 到 该 门 上 的 文件 系统 中 的 路 径 名 也 算 作 一 个 引用 。 我 们 可 以 
删除 这 个 引用 ， 办 法 有 : 调用 fdetach 函 数 ， 运 行 fdetach 程 序 ， 或 者 从 文 
件 系 统 中 删除 该 路 径 名 《〈 既 可 调用 unlink 函 数 ， 也 可 运行 rm 命令 ) 。 

(3) 客 户 中 由 open 返 回 的 描述 符 算 作 一 个 打开 的 引用 ， 直 到 该 描述 符 
关闭 为 止 ， 这 种 关闭 既 可 以 显 式 地 调用 close 完 成 ， 也 可 以 隐 式 地 由 客户 
进程 的 终止 完成 。 本 章 中 已 给 出 的 所 有 客户 进程 都 是 隐 式 地 关闭 门 摘 述 
符 的 。 

我 们 的 第 一 个 例子 展示 ， 如 果 服 务 器 在 调用 fattch 之 后 关闭 所 创建 
的 门 接 述 符 ， 那 么 其 服务 器 过 程 的 不 再 引用 激活 Cunreferenced 
invocation) 将 立即 发 生 。 图 15-16 给 出 了 我 们 的 服务 器 过 程 和 服务 器 
main PÁ Š. 

7 一 10 服务 器 过 程 认 出 特殊 的 不 再 引用 激活 后 输出 一 个 消息 。 当 前 
线程 通过 以 两 个 空 指针 和 两 个 值 为 0 的 大 小 调用 door_retum 从 这 个 特殊 
调用 中 返回 。 

28 fattach 返 回 后 close 所 创建 的 门 描述 符 。fattach 之 后 该 描述 符 对 于 
服务 器 的 唯一 用 途 是 供 调用 door_bind、door_info 或 door_revoke 之 用 。 

启动 该 服务 器 ， 我 们 注意 到 不 再 引用 激活 立即 发 生 : 


solaris 96 serverunref1 /tmp/door1 











door unreferenced 


追踪 该 门 的 引用 计数 变化 情况 ， 它 在 door_create 返 回 后 变 为 1， 在 





fattach 返 回 后 变 为 2。 服 务 器 调用 close 使 它 从 2 变 为 1， 于 是 触发 了 不 再 
引用 激活 。 该 门 现在 所 剩 的 唯一 引用 是 它 在 文件 系统 中 的 路 径 名 ， 它 是 
客户 指 代 该 门 所 需 的 手段 。 这 就 是 说 ， 客 户 仍 能 正常 工作 。 

solaris 96 clientunref1 /tmp/door1 11 

result: 121 

solaris 96 clientunref1 /tmp/door1 22 

result: 484 


doors/serverunref1.c 





1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

5 1 

6 long arg, result; 

7 if (dataptr -- DOOR UNREF DATA) { 

8 printf ("door unreferenced\n") ; 

Door_return(NULL, 0, NULL, 0); 

10 } 

a arg - *((long *) dataptr); 

12 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
13 sleep(6); 

14 result - arg * arg; 

15 Door return((char *) &result, sizeof(result), NULL, 0); 
16 ) 

T7 ant 

18 main(int argc, char **argv) 

19 
20 int fd; 
21 it (arge ls 2) 
22 err quit("usage: serverunrefl <server-pathname>") ; 
23 /* create a door descriptor and attach to pathname */ 
24 fd - Door create(servproc, NULL, DOOR UNREF); 
25 unlink (argv [1]); 
26 Close (Open (argv [1], O CREAT | O_RDWR, FILE MODE) ); 
27 Fattach(fd, argv[1]); 
28 Close (fd); 
29 /* servproc() handles all client requests */ 

30 for (uw) 
31 pause () ; 

32 } 


doors/serverunref1.c 





图 15-16 处 理 不 再 引用 激活 的 服务 器 过 程 

而 且 ， 该 服务 器 过 程 没有 进一步 的 不 再 引用 激活 发 生 。 事 实 上 对 于 
一 个 给 定 门 ， 只 会 递交 一 次 不 再 引用 激活 。 

现在 把 我 们 的 服务 器 程序 改 回 平 冲 的 情形 ， 也 融 是 并 不 close 所 创建 
的 门 描述 符 。 图 15-17 给 出 了 服务 器 过 程 和 服务 嚣 main 函数。 我 们 设置 
了 6 秒 钟 的 睡眠 ， 并 在 服务 器 过 程 返 回 之 前 输出 信息 。 在 一 个 窗口 中 启 
动 服务 右 ， 在 另 一 个 窗口 中 验证 服务 器 所 创建 的 门 的 关联 路 径 名 存在 于 
文件 系统 中 ， 然 后 用 rm 命令 删除 该 路 径 名 : 


solaris % ls -l /tmp/door2 

Drw-r-r-  1rstevens other1 0 Apr 16 08:58 /tmp/door2 

solaris 96 rm /tmp/door2 

RAIAR, BADR SS aE AY AS BESUCHE: 

solaris % serverunref2 /tmp/door2 

door unreferenced 一 旦 从 系统 中 删除 该 路 
径 名 

奶 踪 该 门 的 引用 计数 变化 情况 ， 它 在 door_create 返 回 后 变 为 1， 在 
fattach 返 回 后 变 为 2。 当 我 们 rm 该 门 的 路 径 名 时 ， 这 个 命令 把 它 的 引用 
计数 从 2 降 为 1， 于 是 触发 了 不 再 引用 激活 。 

在 下 面 的 有 关 该 属性 的 最 后 一 个 例子 中 ， 我 们 仍然 从 文件 系统 中 删 
除 路 径 名 ， 不 过 是 在 局 动 门 的 三 次 客户 激活 之 后 。 我 们 要 展示 的 是 ， 
次 客户 激活 给 引用 计数 加 1， 只 有 所 有 三 个 客户 都 终止 后 ， 不 再 引用 激 
活 才 发 生 。 我 们 使 用 先前 的 在 图 15-17 中 给 出 的 服务 器 程序 ， 客 户 程序 
没有 变动 ， 如 图 15-2 所 示 。 














doors/serverunref2.c 





1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

5 { 

6 long arg, result; 

7 if (dataptr == DOOR_UNREF DATA) { 

8 printf ("door unreferenced\n") ; 

9 Door_return(NULL, 0, NULL, 0); 

10 } 

Tf arg - *((long *) dataptr); 

12 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
13 sleep(6); 

14 result - arg * arg; 

I5 printf ("thread id $1d returning\n", pr thread id(NULL)); 
16 Door return((char *) &result, sizeof(result), NULL, 0); 
17 Y 

18 int 

19 main(int argc, char **argv) 

20 ( 

21 int fd; 

22 if (arge != 2) 

23 err quit("usage: serverunref2 <server-pathname>") ; 
24 /* create a door descriptor and attach to pathname */ 
25 fd - Door create(servproc, NULL, DOOR UNREF); 

26 unlink (argv [1]) ; 

27 Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 

28 Fattach(fd, argv[11); 

29 /* servproc() handles all client requests */ 

30 ton 6 m 3 ) 

31 pause () ; 

32 } 


doors/serverunref2.c 





图 15-17 不 关闭 所 创建 门 描述 符 的 服务 器 程序 


solaris % clientunref2 /tmp/door2 44 & clientunref2 /tmp/door2 55 & \ 
clientunref2 /tmp/door2 66 & 





[2] 13552 
[3] 13553 
[4] 13554 
solaris 96 rm /tmp/door2 在 三 个 客户 运行 期 间 


solaris % result: 1936 


result: 3025 

result: 4356 

下 面 是 服务 器 的 输出 : 

solaris % serverunref2 /tmp/door2 

thread id 4,arg = 44 

thread id 5,arg = 55 

thread id 6,arg = 66 

thread id 4 returning 

thread id 5 returning 

thread id 6 returning 

door unreferenced 

追踪 该 门 的 引用 计数 变化 情况 ， 它 在 door_create 返 回 后 变 为 1， 在 
fattach 返 回 后 变 为 2。 当 每 个 客户 调用 open 时 ， 引 用 计数 逐次 加 1， 从 2 变 
为 3， 从 3 变 为 4， 最 后 从 4 变 为 5。 当 我 们 rm 该 门 的 路 径 名 时 ， 引 用 计数 
从 5 变 为 4。 然 后 随 着 每 个 客户 的 终止 ， 引 用 计数 器 从 4 变 为 3， 从 3 变 为 
2， 最 后 从 2 变 为 1， 最 后 这 次 减 1 触 用 了 不 再 引用 激活 。 

以 上 这 些 例子 表明 ， 尽 管 DOOR_UNREF 属 性 的 说 明 很 简单 〈“ 当 引 
用 计数 从 2 变 为 1 时 ， 不 再 引用 激活 发 生 ”) ， 但 是 要 使 用 这 一 特性 ， 必 
须 首先 理解 引用 计数 。 


15.8 描述 符 传 递 


当 考 虑 把 一 个 打开 着 的 描述 符 从 一 个 进程 传递 到 为 一 个 进程 时 ， 我 
们 通 第 想到 以 下 两 点: 

调用 fork 之 后 ， 子 进程 与 父 进程 共享 所 有 打开 痢 的 描述 符 ; 

调用 exec 之 后 ， 所 有 描述 符 通 mter das 

前 一 个 例子 中 ， 父 进程 打开 一 个 描述 符 ， 调 用 fork 派 生出 子 进程 ， 


然后 父 进程 关闭 该 描述 符 ， 由 子 进程 来 处 理 它 。 这 样 就 把 一 个 打开 着 的 
描述 符 从 父 进程 传递 给 了 子 进 程 。 

现今 的 Unix 系 统 扩 充 了 这 种 描述 符 传递 概念 ， 提 供 了 把 任何 打开 着 
的 描述 符 从 一 个 进程 传递 给 任何 其 他 进程 的 能 力 ， 这 两 个 进程 间 有 无 亲 
缘 关 系 皆 可 。 门 提供 了 从 客户 到 服务 器 以 及 从 服务 器 到 客户 的 一 个 描述 
符 传递 API。 

我 们 在 UNPv1 的 14.7 节 [3] 讲述 过 使 用 Unix 域 套 接 字 的 描述 符 传 
递 。 源 日 Berkely 的 内 核 使 用 这 些 套 接 字 传递 描述 符 ，TCPvV3 第 18 章 中 提 
供 了 全 部 细节 。SVR4 内 核 使 用 另 一 种 技术 来 传递 描述 符 ， 即 LSENDFD 
和 I_RECVFD 这 两 个 ijoctl 命 令 ，APUE 的 15.5.1 节 讲述 了 它们 。 但 是 SVR4 
进程 仍 可 以 使 用 Unix 域 套 接 字 来 访问 这 一 内 核 特性 。 

注意 理解 传递 描述 符 的 含义 。 图 4-7 中 ， 服 务 器 打开 文件 后 把 整个 
文件 内 容 复制 到 底部 的 管道 中 。 如 果 该 文件 的 大 小 为 IMB， 那 么 通过 底 
部 的 管道 从 服务 器 往 客户 流动 了 1MB 的 数据 。 然 而 如 果 是 服务 器 往 客户 
传递 回 一 个 描述 符 的 话 ， 通 过 图 4-7 中 底部 的 管道 传递 的 仅仅 是 这 个 描 
述 符 〈 我 们 假设 它 是 某 些 特定 于 内 核 的 小 量 信息 ) ， 而 不 是 文件 本 身 。 
客户 取得 该 描述 符 后 读 出 文件 内 容 ， 并 把 它 写 往 标准 输出 。 所 有 的 文件 
读 出 操作 都 发 生 在 客户 中 ， 服 务 器 只 是 打开 该 文件 。 

注意 ， 服 务 器 不 能 只 是 通过 图 4-7 中 底部 的 管道 写 出 描述 符号 ， 就 
像 以 下 代码 那样 : 

int fd; 

f..Open....); 

Write(pipefd,&fd,sizeof(int)); 

这 种 方法 并 不 奏效 。 描 述 符号 是 特定 于 进程 的 属性 。 假 设 fd 的 值 在 
服务 器 中 为 4。 即 使 该 描述 符 在 客户 中 是 打开 的 ， 也 几乎 可 以 肯定 它 指 
代 的 文件 不 同 于 服务 器 进程 中 描述 符 4 所 指 代 的 文件 〈 从 一 个 进程 到 另 
一 个 进程 描述 符号 意义 不 变 的 唯一 时 刻 是 穿越 fork 前 后 和 穿越 exec 前 





Ja) 。 如 有 果 服 务 器 中 的 最 低 未 用 摘 述 符 为 4， 那 么 服务 器 中 一 个 成 功 的 
open 将 返回 4。 如 果 服 务 器 把 描述 符 4“ 传 递 2 给 客户 ， 而 客户 中 的 最 低 未 
用 描述 符 为 >， 那么 我 们 硕 望 客户 中 的 描述 符 7 与 服务 器 中 的 描述 符 4 指 
代 同 一 个 文件 。APUE 的 图 15-4 和 TCPv3 的 图 18-4 展 示 了 从 内 核 角度 看 来 
必然 发 生 的 情况 : 这 两 个 摘 述 符 〈( 这 儿 的 例子 是 服务 器 中 的 4 和 客户 中 
的 7) 必须 同时 指 同 内 核 中 的 同一 文件 表 项 。 摘 述 符 传递 涉及 一 定 的 内 
核 神 秘技 巧 ， 然 而 像 门 和 Unix 域 套 接 字 这 样 的 API 隐 藏 了 这 些 内 部 细 
节 ， 从 而 允许 进程 们 很 容易 从 一 个 进程 同 男 一 个 进程 传递 描述 符 。 

通过 一 个 门 从 客户 同 服 务 器 传递 描述 符 的 手段 是 ， 把 door_arg_t 结 
构 的 desc_ptr 成 员 设 置 成 指向 一 个 door_desc_t 结 构 的 数组 ，door_num 成 
员 则 设置 成 这 些 door_desc_t 结 构 的 数目 。 从 服务 器 同 客 户 传 递 回 描述 符 
的 手段 是 ， 把 door_returmn 的 第 三 个 参数 设置 成 指向 一 个 door_desc_t 结 构 
的 数组 ， 把 该 函数 的 第 四 个 参数 设置 成 待 传递 描述 符 的 数目 。 

typedef struct door_desc { 


door attr t d attributes: /* tag for union */ 
union { 
struct { /* valid if tag = 
DOOR_DESCRIPTOR */ 
int d_descriptor; /* descriptor number */ 
door id t d id; /* unique id */ 
d desc; 
} d data; 


} door desc t; 

该 结构 含有 一 个 联合 ， 其 第 一 个 成 员 是 一 个 标识 该 联合 中 含有 哪个 
成 员 的 标记 。 不 过 该 联合 当前 只 定义 了 一 个 成 员 〔 描 述 一 个 描述 符 的 
d_desc 结 构 )， 标 记 (d_attributes〉 于 是 必须 设置 为 
DOOR_DESCRIPTOR. 


例子 

我 们 修改 以 前 的 文件 服务 器 例子 〈 回 想 图 1-9) ， 使 服务 圳 打开 文 
件 并 把 打开 着 的 描述 符 传 递 给 客户 ， 然 后 由 客户 把 文件 的 内 容 复制 到 标 
准 输出 。 图 15-18 展 示 了 这 样 的 编排 。 






servproc( ) 
{ 






door_desc_t desc; 









< 


fd = open( ); 
desc... = fd 
door_return(NULL, 0, &desc, 1); 











main( ) 


E are P 
door_call(servfd, ); { 













2 
filefd = arg.desc_ptr->... 
while ( (n = Read(filefd, )) > 0) 
Write(STDOUT_FILENO, ); 


fd = door create( ); 
fattach(fd, path); 








图 15-18 服务 器 传递 回 打 开 着 描述 符 的 文件 服务 器 例子 











图 15-19 给 出 了 客户 程序 。 





doors/clientfdl.c 





1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
& 4 
5 int door, fd; 
6 char argbuf [BUFFSIZE], resbuf[BUFFSIZE], buff [BUFFSIZE]; 
7 size t len, n; 
8 door arg t arg; 
9 if (argc !- 2) 
10 err quit("usage: clientfdl <server-pathname>") ; 
TL door = Open(argv[1], O_RDWR); /* open the door */ 
12 Fgets(argbuf, BUFFSIZE, stdin) ; /* read pathname of file to open */ 
13 len = strlen(argbuf) ; 
14 if (argbuf [len-1] == '\n') 
15 len--; /* delete newline from fgets() */ 
16 /* set up the arguments and pointer to result */ 
T7 arg.data_ptr = argbuf; /* data argument */ 
18 arg.data_size = len + 1; /* size of data argument */ 
19 arg.desc ptr = NULL; 
20 arg.desc num = 0; 
21 arg.rbuf = resbuf; /* data results */ 
22 arg.rsize = BUFFSIZE; /* size of data results */ 
23 Door_call(door, &arg) ; /* call server procedure */ 
24 if (arg.data_size != 0) 
25 err quit ("%.*s", arg.data size, arg.data ptr); 
26 else if (arg.desc ptr -- NULL) 
27 err quit("desc ptr is NULL"); 
28 else if (arg.desc num !- 1) 
29 err quit("desc num - $d", arg.desc num); 
30 else if (arg.desc ptr-»d attributes !- DOOR DESCRIPTOR) 
31 err quit("d attributes - $d", arg.desc ptr-»d attributes); 
32 fd = arg.desc ptr-»d data.d desc.d descriptor; 
33 while ( (n = Read(fd, buff, BUFFSIZE)) > 0) 
34 write (STDOUT_FILENO, buff, n); 
35 exit (0) ; 
36 } 





doors/clientfdl.c 
图 15-19 描述 符 传递 文件 服务 器 例子 的 客户 程序 

打开 门 ， 从 标准 输入 读 入 路 径 名 

9—15 ， 与 竺 打开 的 门 关 联 的 路 径 名 是 一 个 命令 行 参数 。 打 开 该 门 

从 标准 输入 读 入 客户 希望 打开 的 文件 名 ， 并 删 掉 结 尾 的 换行 符 。 

设置 参数 和 指向 结果 的 指针 

16—22 设置 door_arg_t 结 构 。 我 们 给 路 径 名 的 大 小 多 加 了 1， 以 允许 





服务 器 用 空 字符 终止 该 路 径 名 。 

调用 服务 器 过 程 并 检查 结 

23—31 ”调用 服务 器 过 程 ， 然 后 检查 其 结果 是 我 们 预期 的 : 没有 数 
据 ， 有 一 个 描述 符 。 我 们 不 久 将 看 到 ， 服 务 器 只 在 打 不 开 客 户 指定 的 文 
件 时 才 返 回 数据 (含有 一 个 出 错 消 息 ) ， 这 种 情况 下， 我们 调用 err_quit 
输出 这 个 错误 。 

获取 描述 符 ， 把 文件 复制 到 标准 输出 

32~34 从 door_desc_t 结 构 取 得 描述 人 符 ， 然 后 把 相应 的 文件 复制 到 标 
准 输出 。 

图 15-20 给 出 了 服务 器 过 程 。 服 务 器 main 函 数 没有 变化 ， 如 图 15-3 所 











Ze 
doors/serverfdl.c 
1 #include "unpipc.h" 
2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
4 door desc t *descptr, size t ndesc) 
5 { 
6 int fd; 
7 char resbuf [BUFFSIZE]; 
8 door desc t desc; 
9 dataptr[datasize-1] = 0; /* null terminate */ 
10 if ( (fd = open(dataptr, O RDONLY)) == -1) ( 
T] /* error: must tell client */ 
T2 snprintf(resbuf, BUFFSIZE, "$s: can't open, %s", 
13 dataptr, strerror (errno)); 
14 Door return(resbuf, strlen(resbuf), NULL, 0); 
15 } eise ( 
16 /* open succeeded: return descriptor */ 
T7 desc.d data.d desc.d descriptor - fd; 
18 desc.d attributes - DOOR DESCRIPTOR; 
19 Door return(NULL, 0, &desc, 1); 
20 ) 
21. i 


doors/serverfdl.c 
图 15-20 打开 一 个 文件 并 传递 回 其 描述 符 的 服务 器 过 程 
为 客户 打开 文件 
9—14 用 空 字 符 终 止 由 客户 提供 的 路 径 名 ， 然 后 尝试 open 该 文件 。 











如 宁 发 生 错误 ， 数 据 结 果 融 是 含有 相应 出 错 消 息 的 字符 串 。 
成 功 
15~20 如 果 open 成 功 ， 那 束 返 回 所 得 到 的 描述 符 ， 这 时 没有 数据 结 





e 
我 们 启动 服务 器 ， 指 定 其 待 创建 的 门 的 路 径 名 为 /tmp/fd1， 然 后 运 

HEP FEE 

solaris 96 clientfd1 /tmp/fd1 

/etc/shadow 

/etc/shadow: can't open,Permission denied 

solaris 96 clientfd1 /tmp/fd1 

/no/such/file 

/no/such/file: can't open, No such file or directory 

solaris 96 clientfd1 /tmp/df1 

/etc/ntp.conf — 4S AA 247 SCA SC 
fr 

multicastclient 224.0.1.1 

driftfile /etc/ntp.drift 

前 面 两 次 我 们 指定 了 导致 出 错 返 回 的 路 径 名 ， 最 后 一 次 服务 器 返回 
了 一 个 只 合 2 行 文本 的 文件 的 描述 符 。 

通过 门 来 传递 描述 符 存 在 一 个 问题 。 在 我 们 的 例子 中 要 看 到 这 个 问 
题 ， 只 需 在 服务 器 过 程 中 成 功 的 open 调 用 之 后 加 一 个 printf 语 句 。 你 将 看 
到 每 次 打开 的 描述 符 值 比 上 一 个 描述 符 值 大 1。 问 题 在 于 服务 器 把 这 些 
描述 符 传递 给 客户 后 没有 关闭 它们 。 然 而 没有 简单 的 办 法 做 到 这 一 点 。 
从 逻辑 上 讲 ， 执 行 close 的 合适 位 置 是 在 door_retum 返 回 之 后 ， 因 为 那 时 
所 打开 的 描述 符 已 发 送 给 客户 ， 然 而 door_retum 并 不 返回 ! 要 是 我 们 通过 
一 个 Unix 域 套 接 字 使 用 sendmsg 来 传递 该 描述 符 ， 或 者 通过 一 个 SVR4 管 
道 使 用 ioct 来 传递 它 ， 那 么 可 以 在 sendmsg 或 ioct 返 回 后 close 它 。 然 而 门 











的 描述 符 传 递 规范 不 同 于 这 两 种 技术 ， 因 为 从 传递 描述 符 的 函数 上 不 会 
有 返回 发 生 。 绕 过 这 个 问题 的 唯一 办 法 是 ， 让 服务 右 过 程 以 菜 种 方式 记 
独 它 已 打开 了 一 个 描述 符 ， 并 在 以 后 茶 个 时 候 关 财 它 ， 这 么 一 来 程序 会 





变 得 非常 杂乱 。 
这 个 问题 到 Solaris 2.7 中 应 得 到 纠正 ， 办 法 是 增加 一 个 新 的 


DOOR_RELEASE 属 性 。 发 送 者 把 d_attributes 设 置 成 
DOOR DESCRIPTOR | DOOR_RELEASE， 这 样 告 诉 系统 在 把 相应 的 描 
述 符 传递 给 接收 者 之 后 要 将 其 关闭 。 


15.9 door sever create pk ZA 


我 们 随 图 15-9 展 示 出 ， 当 客户 请 求 到 达 时 ， 门 函数 库 会 按照 处 理 它 
们 的 需要 自动 地 创建 新 线程 。 这 些 线程 由 该 函数 库 作 为 脱离 的 线程 创 
建 ， 具 有 默认 的 线程 栈 大 小 ， 禁 止 了 线程 取消 功能 ， 并 具有 从 调用 
door_create 的 线程 初始 继承 来 的 信号 掩 码 和 调度 类 。 如 果 我 们 想 要 改变 
上 述 任何 特性 ， 或 者 希望 杀 自 管理 服务 器 线程 池 ， 那 么 可 以 调用 
door_server_create 以 指定 我 们 自己 的 服务 器 创建 过 程 (sever creation 


procedure) 。 











#include <door.h> 

typedef void Door_create_proc(door_info_t *); 

Door_create_proc *door_server_create(Door_create_proc *proc); 

返回 : 指向 先前 的 服务 器 创建 过 程 的 指针 

跟 15.3 节 中 door_create 的 声明 一 样 ， 我 们 使 用 C 的 typedef 语 句 来 简化 
库 函 数 的 函数 原型 。 我 们 的 新 数据 类 型 把 服务 右 创 建 过 程 定 义 为 接受 单 
个 参数 〈 指 同一 个 door_info_t 结 构 的 指针 ) ， 不 返回 任何 值 (void) 。 
当 我 们 调用 door_server_create 时 ， 其 参数 是 指 同 我 们 的 服务 器 创建 过 程 
的 指针 ， 返 回 值 是 指向 上 一 个 服务 器 创建 过 程 的 指针 。 








每 当 需 要 一 个 新 线程 来 给 某 个 客户 请 求 提 供 服 务 时 ， 我 们 的 服务 器 
创建 过 程 就 被 调用 。 至 于 哪个 服务 器 过 程 需 要 这 个 新 线程 的 信息 则 存放 
在 其 地 址 作为 参数 传递 进 本 创建 过 程 的 door_info_t 结 构 中 。 该 结构 的 
di_proc 成 员 含有 这 个 服务 器 过 程 的 地 址 ，di_data 成 员 则 含有 该 服务 器 过 
程 每 次 被 调用 时 所 传递 进去 的 cookie 指 针 。 

查看 所 发 生 的 活动 的 最 简单 办 法 是 使 用 例子 。 我 们 的 客户 程序 没有 
变化 ， 如 图 15-2 所 示 。 我 们 的 服务 器 程序 中 除 原来 的 服务 器 过 程 函 数 和 
main 函 数 外 ， 增 加 了 两 个 新 函数 。 图 15-21 给 出 服务 器 进程 中 四 个 函数 
的 关系 概貌 ， 当 时 一 些 函 数 已 注册 而 且 所 有 函数 都 已 调用 。 

图 15-22 给 出 了 服务 器 程序 main 函 数 。 

与 图 15-3 相 比 ， 有 四 个 变动 : (1) 去 掉 了 门 描述 符 fd 的 声明 ( 它 现 
在 是 一 个 我 们 将 在 图 15-23 中 给 出 并 描述 的 全 局 变量 ) ; (20. 以 一 个 互 
斥 锁 保 护 door_create 调 用 (也 在 图 15-23 中 说 明 )〉; G) 在 创建 门 之 前 
调用 door_server_create， 将 其 参数 指定 为 我 们 的 服务 器 创建 过 程 

(my_create， 它 将 在 下 面 给 出 ) ; (4) door_create 调 用 中 ， 最 后 一 个 

参数 (属性 ) 现在 是 DOOR_PRIVATE 而 不 是 0。DOOR_PRIVATE 告 诉 

门 浮 数 库 本 门将 有 它 自 己 的 称 为 私 用 服务 器 池 (private server pool) 的 
线程 池 。 

使 用 DOOR_PRIVATE 指 定 一 个 私 用 服务 器 池 和 使 用 
door _ server_create 指 定 一 个 服务 器 创建 过 程 是 互相 独立 的 。 总 共有 以 下 
四 种 可 能 情形 。 








—»- servproc( ) 
{ 













e 服务 器 过 程 
door_return( ); 
每 个 新 线程 启动 时  ? 每 个 线程 逻辑 上 显得 
执行 my_thread 到 servproc 中 继续 
= my_thread( ) 执行 ， 从 而 为 每 个 客 
{ 户 调用 提供 服务 
SIIR 由 每 个 服务 
door_bind( ); 器 线程 执行 
door_return( ); 的 函数 
} 
my_create( ) 
mak 
服务 器 创 
create( , my_thread, ); 建 过 程 
注册 my_create ) 


hens server_create(my_create) ; 


fa = door_create(servproc, ); 


作为 本 门 的 服务 器 过 程 注册 
servproc; 并 执行 my create } 
以 创建 第 一 个 线程 


图 15-21 我 们 的 服务 器 进程 中 四 个 函数 的 概貌 


doors/server6.c 





42 int 

43 main(int argc, char **argv) 

44 { 

45 if (ange) l= 2) 

46 err quit("usage: server6 <server-pathname>") ; 
47 Door server create (my create); 

48 /* create a door descriptor and attach to pathname */ 
49 Pthread mutex lock (&fdlock) ; 

50 fd - Door create(servproc, NULL, DOOR PRIVATE); 

5T Pthread mutex unlock (&fdlock) ; 

52 unlink (argv [1] ) 

53 Close (Open(argv[1], O CREAT | O_RDWR, FILE MODE) ) ; 
54 Fattach(fd, argv[1]); 

55 /* servproc() handles all client requests */ 
56 Fox X um) 

57 pause () ; 

58 } 


doors/server6.c 




















图 15-22 线程 池 管 理 例 子 程序 的 main 函 数 





(DERE: 没有 私 用 服务 器 池 ， 也 没有 服务 器 创建 过 程 。 系 统 根 
据 需 要 创建 线程 ， 它 们 都 进入 进程 范围 的 线程 池 。 

(2) 指 定 DOOR_PRIVATER， 不 过 没有 服务 器 创建 过 程 。 系 统 根据 
需要 创建 线程 ， 对 于 创建 时 没有 指定 DOOR_PRIVATE 属 性 的 门 ， 新 创 
建 的 线程 将 进入 进程 范围 的 池 ， 对 于 创建 时 指定 了 DOOR_PRIVATE 属 
性 的 门 ， 新 创建 的 线程 将 进入 该 门 的 私 用 服务 器 池 。 

(3) 没 有 私 用 服务 器 ， 但 是 指定 了 一 个 服务 器 创建 过 程 。 每 当 需 要 一 
个 新 线程 时 ， 该 服务 器 创建 过 程 就 被 调用 ， 所 创建 的 线程 都 进入 进程 范 
围 的 线程 池 。 

(4) 指 定 DOOR_PRIVATE， 同 时 指定 了 一 个 服务 器 创建 过 程 。 每 当 
需要 一 个 新 线程 时 ， 该 服务 器 创建 过 程 就 被 调用 。 一 个 线程 创建 出 来 
后 ， 必 须 调用 door_bind 把 自己 赋 给 合适 的 私 用 服务 占 池 ， 天 则 它 将 被 赋 
给 进程 范围 的 线程 池 。 

图 15-23 给 出 了 我 们 的 两 个 新 函数 : my_create 和 my_thread。 
my_create 是 我 们 的 服务 器 创建 过 程 ， 它 把 my_thread 指 定 为 它 所 创建 的 
每 个 线程 都 要 执行 的 函数 。 








doors/server6.c 





13 pthread mutex t fdlock = PTHREAD MUTEX INITIALIZER; 


14 static int fd = -1; /* door descriptor */ 

15 void * 

16 my thread(void *arg) 

147 t 

18 int oldstate; 

19 door info t *iptr - arg; 

20 if ((Door server proc *) iptr-»di proc -- servproc) ( 

21 Pthread mutex lock (&fdlock); 

22 Pthread mutex unlock (&fdlock) ; 

23 Pthread setcancelstate(PTHREAD CANCEL DISABLE, &oldstate); 
24 Door_bind (fd) ; 

25 Door_return(NULL, 0, NULL, 0); 

26 } else 

27 err quit("my thread: unknown function: %p", "(Door Server proc*)iptr-*di proc"); 
28 return (NULL); /* never executed */ 

29 } 

30 void 

31 my create(door info t *iptr) 

32 ( 

33 pthread t tid; 

34 pthread attr t attr; 

35 Pthread attr init(&attr); 

36 Pthread attr setscope(&attr, PTHREAD SCOPE SYSTEM); 

37 Pthread attr setdetachstate(&attr, PTHREAD CREATE DETACHED); 
38 Pthread create(&tid, &attr, my thread, (void *) iptr); 

39 Pthread attr destroy (&attr); 

40 printf ("my create: created server thread %ld\n", pr thread id(&tid)); 
41 ) 


doors/server6.c 





图 15-23 我 们 自己 的 线程 管理 函数 











服务 器 创建 过 程 

30—41 ”每 当 my_create 被 调用 时 ， 我 们 就 创建 一 个 新 线程 。 但 是 在 
调用 pthread_create 前 ， 我 们 先 初 始 化 该 线程 的 属性 ， 设 置 其 竞 用 范围 
(contention scope) 为 PTHREAD_SCOPE_SYSTEM， 将 它 指定 为 脱离 
的 线程 。 接 着 调用 pthread_create 创 建 该 线程 ， 它 启动 执行 的 是 my_thread 
函数 。 服 务 器 创建 过 程 以 及 新 线程 启动 函数 的 参数 都 是 指 癌 竺 激活 之 门 
的 door_info_t 结 构 的 指针 。 如 果 有 一 个 融 多 个 门 的 服务 器 ， 而 且 指定 了 
一 个 服务 器 创建 过 程 ， 该 服务 器 创建 过 程 就 在 其 中 任何 一 个 门 需要 一 个 
新 线程 时 被 调用 。 该 服务 器 创建 过 程 以 及 由 它 指定 给 pthread_create 的 线 











程 启动 函数 区 分 这 些 不 同 的 服务 器 过 程 的 唯一 办 法 是 : 得 看 该 
door_info_t 结 构 中 的 di_proc 指 针 。 

把 竞 用 范围 设置 成 PTHREAD_SCOPE_SYSTEM 意 味 着 本 线程 将 跟 
其 他 进程 中 的 线程 竞争 处 理 器 资源 的 使 用 。 与 之 相对 的 
PTHREAD_SCOPE_PROCESS 意 味 着 本 线程 只 跟 本 进程 内 的 其 他 线程 苋 
争 处 理 器 资源 的 使 用 。 后 者 对 于 门 不 起 作用 ， 因 为 门 函 数 库 要 求 执 行 
door_return 的 内 核 轻 权 进程 跟 引 发 这 个 激活 请 求 的 轻 权 进程 相同 。 未 绑 
定 的 线程 (PTHREAD SCOPE PROCESS) 可 能 在 执行 服务 器 过 程 期 间 
改变 轻 权 进程 。 [4] 

要 求 作为 脱离 的 线程 来 创建 新 线程 是 为 了 防止 系统 在 该 线程 终止 时 
保存 有 关 它 的 任何 信息 ， 因 为 不 会 有 其 他 线程 对 它 调用 pthread_join。 

线程 启动 函数 

15—20 ”my_thread 是 通过 调用 pthread_create 指 定 的 线程 启动 函数 。 
传递 给 它 的 参数 是 早先 传递 进 my_create 函 数 的 指向 待 激活 之 门 的 
door_info_t 结 构 的 指针 。 本 进程 中 唯一 存在 的 服务 器 过 程 是 servproc， 
此 我 们 只 是 验证 该 参数 引用 了 这 个 过 程 。 

等 待 描述 符 变 为 有 效 

21—22 服务 器 创建 过 程 在 door_create 首 次 被 调用 时 调用 ， 目 的 是 为 
了 创建 一 个 初始 的 服务 器 线程 。 门 函数 库 中 该 调用 是 在 door_create 返 回 
前 发 出 的 。 然 而 变量 fd 要 到 door_create 返 回 后 才 含 有 有 效 的 门 描述 符 。 

(这 是 一 个 鸡 与 重 的 问题 。) 既然 知道 my_thread 是 作为 独立 于 调用 
door_create 的 主线 程 的 男 一 个 线程 运行 的 ， 我 们 解决 这 个 定时 问题 的 办 
法 于 是 就 是 按 下 述 方式 使 用 互 斥 锁 fdlock: 主线 程 在 调用 door_create 前 
给 该 互 斥 锁 上 锁 ， 在 door_create 返 回 并 往 fa 中 存 入 一 个 值 〈 图 15-22) 后 
给 该 互 斥 锁 解 锁 。 我 们 的 my_thread 函 数 先 是 给 该 互 斥 锁 上 锁 (也 许 要 
阻塞 到 主线 程 解 开 该 互 斥 锁 为 止 ) ， 然 后 给 它 解 锁 。 我 们 也 许可 以 增设 
一 个 由 主线 程 同 它 发 送信 号 的 条 件 变 量 ， 不 过 这 儿 没 有 这 个 必要 ， 因 为 


























我 们 知道 将 发 生 的 调用 的 顺序 。 

禁止 线程 取消 功能 

23 ” 当 使 用 pthread_create 创 建 一 个 新 的 Posix 线 程 时 ， 线 程 取消 功能 
默认 是 启用 的 。 这 种 情况 下 ， 当 某 个 客户 中 止 一 个 进展 中 的 door_call 调 
用 时 (我 们 将 在 图 15-31 中 展示 这 个 操作 〉， ， 线 程 取 消 处 理 程序 (如 果 
有 的 话 ) 将 被 调用 ， 相 应 的 服务 器 过 程 所 在 线程 随后 终止 。 在 取消 功能 
禁止 的 情况 下 《〈 如 这 儿 将 做 的 那样 ) ， 当 某 个 客户 中 止 一 个 进展 中 的 
door_call 调 用 时 ， 相 应 的 服务 器 过 程 仍然 完成 (其 所 在 的 线程 未 被 终 
止 》”， 不 过 来 自 door_return 的 结果 被 简单 地 丢弃 。 既 然 取 消 功 能 启用 时 
服务 器 线程 有 可 能 被 终止 ， 而 且 服 务 器 过 程 当时 可 能 处 于 为 其 客户 执行 
的 某 个 操作 中 《 它 可 能 持 有 某 些 锁 或 信号 量 ) ， 因 此 门 函数 库 《默认 ) 
禁止 了 由 它 创建 的 所 有 线程 的 线程 取消 功能 。 如 果 一 个 服务 器 过 程 希望 
在 某 个 客户 过 早 终 止 时 被 取消 ， 那 么 它 所 在 的 线程 必须 局 用 取消 功能 ， 
并 准备 好 处 理 这 种 事件 。 

注意 ，PTHREAD_SCOPE_SYSTEM 况 用 范围 和 脱离 状态 时 在 创建 
线程 时 作为 属性 指定 的 。 然 而 取消 模式 只 能 由 当 事 线 程 本 里 在 开始 运行 
后 设置 。 事 实 上 ， 即 使 我 们 禁止 了 取消 功能 ， 线 程 仍 能 在 任何 时 候 随 心 
所 欲 地 启用 和 禁止 它 。 

把 本 线程 捆绑 到 一 个 门 

24 ， 调用 door_bind 把 调用 线程 捆绑 到 与 某 个 门 关联 的 私 用 服务 器 
池 ， 其 中 该 门 的 描述 符 为 该 函数 的 参数 。 既 然 该 调用 需要 这 个 门 描述 
符 ， 于 是 我 们 让 fd 成 为 这 个 版 本 的 服务 器 程序 的 一 个 全 局 变量 。 

使 得 本 线程 对 于 客户 调用 可 用 

25 通过 以 两 个 空 指针 和 两 个 0 长 度 为 参数 调用 door_return， 本 线程 
使 其 自身 对 于 外 来 的 门 激活 请 求 可 用 。 

图 15-24 给 出 了 服务 器 过 程 。 它 与 图 15-9 中 的 版 本 相同 。 














doors/server6.c 


1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

E 

6 long arg, result; 

7 arg - *((long *) dataptr); 

8 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
9 sleep (5); 
10 result - arg * arg; 
11 Door return((char *) &result, sizeof(result), NULL, 0); 
12. } 





doors/server6.c 


图 15-24 服务 器 过 程 
为 展示 所 发 生 的 情况 ， 我 们 首先 启动 服务 器 : 


solaris % server6 /tmp/door6 





my_create: created server thread 4 

服务 器 局 动 后 一 调用 door_create， 我 们 的 服务 器 创建 过 程 束 被 首次 
调用 ， 尽 管 当时 我 们 还 没有 局 动 客户 。 这 就 创建 了 第 一 个 线程 ， 它 将 等 
待 第 一 个 客户 调用 请 求 。 我 们 然后 接连 运行 客户 程序 三 次 。 

solaris 96 client6 /tmp/door6 11 

result: 121 

solaris 96 client6 /tmp/door6 22 

result: 484 

solaris 96 client6 /tmp/door6 33 

result: 1089 

查看 服务 器 的 相应 输出 ， 我 们 看 到 第 一 个 调用 发 生 时 创建 了 男 一 个 
线程 〈 其 线程 ID 为 5) ， 然 后 ID 为 4 的 线程 给 所 有 三 个 客户 请 求 提 供 了 服 
务 。 门 函数 库 看 来 总 是 保留 一 个 额外 的 线程 备用 。 

my_create: created server thread 5 

thread id 4,arg = 11 

thread id 4,arg = 22 











thread id 4,arg = 33 

接着 在 后 台 几 乎 同时 执行 客户 程序 三 次 : 

solaris % client6 /tmp/door6 44 & client6 /tmp/door6 55 & \ 
client6 /tmp/door6 66 & 


[2] 4919 
[3] 4920 
[4] 4921 


solaris % result: 1936 

result: 4356 

result: 3025 

AERA, RIE SIGUE SPSS AE RIEDI A] 
为 6 和 7) ， 给 三 个 客户 请 求 提供 服务 的 分 别 是 线程 4、5 和 6。 

thread id 4,arg = 44 

my_create: created server thread 6 

thread id 5,arg = 66 

my_create: created server thread 7 

thread id 6,arg = 55 


15.10 door bind. door unbind 和 door revoke ps 24 


加 上 以 下 三 个 额外 函数 后 ， 门 API 就 完整 了 。 
#include <door.h> 
int door_bind(int fd); 
int door_unbind(void); 
int door_revoke(int fd); 
均 返 回 : ATW AO, AENA- 
我 们 在 图 15-23 中 引入 了 door_bind 函 数 。 它 把 调用 线程 捆绑 到 与 描 


述 符 为 fd 的 门 关 联 的 私 用 服务 器 池 中 。 如 果 调 用 线程 已 绑 定 在 另外 某 个 
门 上 ， 那 就 执行 一 个 隐 式 的 松绑 操作 。 
door_unbind 显 式 地 把 调用 线程 从 其 已 绑 定 的 门 上 松绑 。 
door_revoke 撤 销 对 于 由 fd 标识 的 门 的 访问 。 一 个 门 描述 符 只 能 由 创 
建 它 的 进程 撤销 。 调 用 该 函数 时 已 在 进展 中 的 任何 门 激 活 实 例 仍 允 许 正 
党 地 完成 。 


15.11 客户 或 服务 器 的 过 早 终止 








到 此 为 止 的 所 有 例子 都 假设 客户 和 服务 器 上 都 没有 异常 之 事 发 生 。 
我 们 现在 考虑 客户 和 服务 器 任何 一 方 出 错时 发 生 什 么 情况 。 我 们 知道 ， 
当 客 户 和 服务 器 处 于 同一 个 进程 中 时 《图 15-1 中 的 本 地 过 程 调 用 ) ， 客 
户 不 必 担 心服 务 器 的 崩 演 ， 反 之 亦 然 ， 因 为 如 果 任 何 一 方 骨 尝 ， 那 么 整 
个 进程 朋 涡 。 然 而 当 客户 和 服务 器 分 散 到 两 个 进程 上 时 ， 我 们 必须 考虑 
任何 一 方 朋 省 时 会 发 生 什 么 情况 ， 以 及 如 何 通知 对 方 这 种 失败 。 客 户 和 
服务 器 无 论 是 在 同一 台 主 机 上 还 是 在 不 同 的 主机 上 ， 我 们 都 得 考虑 这 些 
问题 。 

15.11.1 服务 器 的 过 早 终 目 

客户 阻塞 在 door_call 调 用 中 等 待 结果 期 间 ， 必 须知 道 服务 器 线程 是 
侍 因 某 种 原因 而 终止 了 。 为 了 观察 所 发 生 的 情况 ， 我 们 让 服务 器 过 程 调 
用 pthread_exit 以 终止 所 在 的 线程 。 这 样 仅仅 终止 该 线程 本 里 ， 而 不 是 终 
止 整个 服务 器 进程 。 图 15-25 给 出 了 服务 器 过 程 。 











doors/serverintr1.c 


1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

E door desc t *descptr, size t ndesc) 

5 { 

6 long arg, result; 

y pthread exit (NULL); /* and see what happens at client */ 
8 arg - *((long *) dataptr); 

9 result - arg * arg; 
10 Door return((char *) &result, sizeof(result), NULL, 0); 
M 


图 15-25 被 激活 后 终止 其 自身 的 服务 器 过 程 | 
服务 器 程序 的 其 余部 分 没有 变化 ， 如 图 15-3 所 示 ， 客 户 程序 没有 变 
化 ， 如 图 15-2 所 示 。 
运行 客户 程序 ， 我 们 看 到 如 果 服 务 器 过程 在 返回 前 终止 了 ， 那 么 客 
户 的 door_call 将 返回 一 个 EINTR 错 误 。 


solaris % clientintr1 /tmp/door1 11 














door. call error: Interrupted system call 

15.11.2 door_call 系 统 调用 的 中 断 性 

door_call 的 手册 页 面 警 告 说 ， 该 函数 不 是 一 个 可 重新 启动 的 系统 调 
用 。( 门 函数 库 a 的 系统 调用 。) 通过 把 服 
务 占 程序 修改 成 其 中 的 服务 器 过 程 在 返回 前 睡 虐 6 秒 钟 ， 我 们 就 可 以 看 
到 这 种 特性 。 图 15-26 给 出 了 这 个 服务 嚣 过程 。 


doors/serverintr2.c 





1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door_desc_t *descptr, size_t ndesc) 

51 

6 long arg, result; 

Zi sleep (6) ; /* let client catch SIGCHLD */ 
8 arg = *((long *) dataptr) ; 

9 result = arg * arg; 
10 Door_return((char *) &result, sizeof(result), NULL, 0); 
11 } 


doors/serverintr2.c 








图 15-26 睡眠 6 秒 钟 的 服务 器 过 程 

















我 们 然后 对 图 15-2 给 出 的 客户 程序 进行 修改 ， 即 建立 一 个 SIGCHLD 
言 号 处 理 程 序 ，fork 一 个 子 进 程 ， 让 子 进程 睡眠 2 秒 后 终止 。 这 么 一 来 ， 
客户 父 进程 调用 door_call 后 约 2 秒 时 ， 该 父 进 程 捕获 SIGCHLD 信 号 ， 接 
着 其 信号 处 理 程 序 返 回 ， 从 而 中 晰 door_call 系 统 调 用 。 图 15-27 给 出 了 这 
dro FOU 


doors/clientintr2.c 





1 #include "unpipc.h" 

2 void 

3 sig chld(int signo) 

4{ 

5 return; /* just interrupt door_call() */ 
6 } 

7 int 

8 main(int argc, char **argv) 

9 ( 

10 int fd; 

LL long ival, oval; 

12 door arg t arg; 

13 if (arge {= 3) 

14 err quit ("usage: clientintr2 <server-pathname> <integer-value>") ; 
15 fd = Open(argv[1], O_RDWR); /* open the door */ 

16 /* set up the arguments and pointer to result */ 

Ty ival = atol(argv[21); 

18 arg.data_ptr = (char *) &ival; /* data arguments */ 
19 arg.data_size = sizeof (long); /* size of data arguments */ 
20 arg.desc_ptr = NULL; 
21 arg.desc_num = 0; 
22 arg.rbuf = (char *) &oval; /* data results */ 
23 arg.rsize = sizeof (long); /* size of data results */ 
24 Signal (SIGCHLD, sig _chld) ; 
25 if (Fork() == 0) { 
26 sleep (2); /* child */ 
27 exit (0); /* generates SIGCHLD */ 
28 } 
29 /* parent: call server procedure and print result */ 
30 Door call(fd, &arg) ; 

31 printf("result: %ld\n", oval); 

32 exit (0); 

3i) 


doors/clientintr2.c 





图 15-27 2 秒 钟 后 捕获 SIGCHLD 信 号 的 客户 程序 
客户 看 到 的 错误 就 像 服 务 器 过 程 过 早 地 终止 一 样 ， 都 是 EINTR。 


solaris % clientintr2 /tmp/door2 22 





door_call error: Interrupted system call 

这 意味 着 我 们 必须 阻塞 调用 door_call 期 间 可 能 产生 的 任何 信号 ， 防 
止 它们 被 递交 给 进程 ， 因 为 这 些 信 号 会 中 呆 door_call。 

15.11.3 等 势 过 程 与 非 等 势 过 程 

要 是 我 们 知道 刚刚 捕获 了 一 个 信号 ， 当 检测 到 由 door_call 返 回 的 


EINTR 错 误 后 接着 再 次 调用 同一 个 服务 器 过 程 ， 情 况 会 怎么 样 呢 ? 这 人 么 
ee 而 不 是 来 自 服务 器 过 程 的 过 早 终 


Kies 


然而 这 么 做 会 导致 我 们 将 马上 看 到 的 问题 。 
首先 把 服务 器 过 程 修改 为 : COD) 当 被 调用 时 输出 当前 线程 ID 


(2) 睡眠 6 秒 ， 〈3) 在 返回 之 前 输出 当前 线程 ID。 图 15-28 给 出 了 这 个 
版 本 的 服务 器 过 程 。 


doors/serverintr3.c 





1 #include "unpipc.h" 
2 void 
3 servproc (void *cookie, char *dataptr, size t datasize, 
4 door desc t *descptr, size t ndesc) 
B1 
6 long arg, result; 
7 printf ("thread id $1d called\n", pr thread id(NULL)); 
8 sleep(6); /* let client catch SIGCHLD */ 
9 arg - *((long *) dataptr); 
10 result - arg * arg; 
TT printf("thread id $1d returning\n", pr thread id(NULL)); 
12 Door return((char *) &result, sizeof(result), NULL, 0); 





其 信和 号 


doors/serverintr3.c 
图 15-28 当 被 调用 时 和 准备 返回 时 输出 当前 线程 ID 的 服务 器 过 程 

图 15-29 给 出 了 我 们 的 客户 程序 。 

2 一 8 声明 全 局 变量 caught_sigchld， 它 在 SIGCHLD 信 号 被 捕获 时 由 

处 理 程序 设置 为 1。 

31~42 只 要 返回 的 错误 是 EINTR， 而 且 这 是 由 我 们 的 信和 号 处 理 程序 





导致 的 ， 我 们 就 在 一 个 循环 中 调用 door_call。 


如 果 只 看 客户 的 输出 ， 那 么 似乎 没有 问题 : 
solaris % clientintr3 /tmp/door3 33 
calling door_call 
calling door_call 
result: 1089 
第 一 次 调用 door_call 后 约 2 秒 时 ， 我 们 的 信号 处 理 程序 激活 ， 把 


caught_sigchld 设 置 为 1， 该 信号 处 理 程序 的 返回 导致 第 一 次 door_call 调 


用 返回 EINTR 错 误 ， 我 们 于 是 再 次 调用 door_call。 第 二 次 调用 时 服务 器 
过 程 运 行 到 完毕 ， 从 而 返回 预期 的 结果 。 

但 是 查看 服务 器 的 输出 ， 我 们 发 现 服务 器 过 程 调 用 了 两 次 : 

solaris % serverintr3 /tmp/door3 

thread id 4 called 

thread id 4 returning 

thread id 5 called 

thread id 5 returning 

客户 的 第 一 次 door_call 调 用 被 所 捕获 的 信号 中 断后 ， 它 的 第 二 次 
door_call 调 用 启动 了 再 次 调用 服务 器 过 程 的 男 一 个 线程 。 如 果 该 服务 器 
过 程 是 等 势 的 (idempotent) ， 那 是 没有 问题 。 但 是 如 果 该 服务 器 过 程 
是 非 等 势 的 ， 那 就 有 问题 了 。 

等 势 Cidempotent) 一 词 在 用 于 描述 一 个 过 程 时 ， 意 思 是 该 过 程 可 
调用 任意 多 次 而 不 出 问题 。 我 们 那个 计算 平方 值 的 服务 右 过 程 是 等 势 
HJ: 不 论调 用 一 次 还 是 两 次 ， 我 们 都 得 到 正确 的 结果 。 另 外 一 个 等 势 过 
程 的 例子 是 返回 当前 时 间 和 日 期 的 过 程 。 尽 管 该 过 程 每 次 可 能 返回 不 同 
的 信息 《譬如 说 它 被 调用 了 两 次 ， 彼 此 相差 1 秒 ， 于 是 导致 返回 时 间 也 
相差 1 秒 ) ， 不 过 仍然 是 正确 的 。 非 等 势 过 程 的 经 典 例 子 是 从 有 个 银行 
账户 减 去 一 笔 费用 的 过 程 ， 除非 该 过 程 只 调用 了 一 次 ， 人 奋 则 最 终结 果 是 
错误 的 。 




















1 #include "unpipc.h" 


2 volatile sig atomic t caught sigchld; 


doors/clientintr3.c 


3 void 

4 sig chld(int signo) 

5 { 

6 caught_sigchld = 1; 

7 return; /* just interrupt door_call() */ 
8 } 

9 int 

10 main(int argc, char **argv) 

1i d 

12 int fd, rc; 

13 long ival, oval; 

14 door arg t arg; 

15 If (arga ls 3) 

16 err quit("usage: clientintr3 <server-pathname> <integer-value>") ; 
177 fd - Open(argv[1], O RDWR); /* open the door */ 

18 /* set up the arguments and pointer to result */ 

19 ival = atol(argv[2]); 

20 arg.data ptr - (char *) &ival; /* data arguments */ 
21 arg.data size - sizeof (long); /* size of data arguments */ 
22 arg.desc ptr - NULL; 

23 arg.desc num - 0; 

24 arg.rbuf - (char *) &oval; /* data results */ 

25 arg.rsize = sizeof (long); /* size of data results */ 
26 Signal(SIGCHLD, sig chld); 

27 if (Fork() == 0) { 

28 sleep (2) ; /* child */ 

29 exit (0) ; /* generates SIGCHLD */ 

30 } 

31 /* parent: call server procedure and print result */ 
32 fon (nat 

33 printf ("calling door call n"); 

34 if ( (rc = door call(fd, &arg)) -- 0) 

35 break; /* success */ 

36 if (errno -- EINTR && caught sigchld) ( 

37 caught sigchld - 0; 

38 continue; /* call door call() again */ 
39 ) 

40 err sys("door call error"); 

41 } 

42 printf ("result: %ld\n", oval); 

43 exit (0); 

44 } 





图 15-29 接收 到 EINTR 错 误 后 再 次 调用 door_call 的 客户 程序 
15.11.4 客户 的 过 早 终 止 


doors/clientintr3.c 


现在 看 一 看 客户 在 调用 door_call 之 后 但 在 服务 器 返回 之 前 终止 时 ， 
服务 器 过 程 是 如 何 得 到 通知 的 。 图 15-30 给 出 了 我 们 的 客户 程序 。 


doors/clientintr4.c 





1 #include "unpipc.h" 


2 amt 
3 main(int argc, char **argv) 


4 { 
5 int fd; 

6 long ival, oval; 
7 door arg t arg; 

8 
9 


if (argc != 3) 
err quit("usage: clientintr4 <server-pathname> <integer-value>") ; 


10 fd - Open(argv[1], O RDWR); /* open the door */ 

11 /* set up the arguments and pointer to result */ 

12 ival = atol(argv[2]); 

13 arg.data_ptr = (char *) &ival; /* data arguments */ 
14 arg.data_size = sizeof (long); /* size of data arguments */ 
15 arg.desc_ptr = NULL; 

16 arg.desc_num = 0; 

17 arg.rbuf = (char *) &oval; /* data results */ 

18 arg.rsize = sizeof (long); /* size of data results */ 
19 /* call server procedure and print result */ 

20 alarm(3); 

21 Door call(fd, &arg); 

22 printf("result: $1dWMn", oval); 

23 exit (0); 

24 ) 


doors/clientintr4.c 





[15-30 调用 door_call 后 过 早 终止 的 客户 程序 


20 与 图 15-2 相 比 唯一 的 变化 是 ， 在 调用 door_call 之 紧 前 调用 
alarm(3)。 访 函数 调度 了 一 个 3 秒 后 发 出 的 SIGALAM 信 号， 但 是 由 于 我 
们 没有 捕获 这 个 信号 ， 因 此 它 的 默认 行为 是 终止 客户 进程 。 这 将 导致 客 
户 在 door_call 返 回 前 终止 ， 因 为 我 们 将 在 服务 器 过 程 中 放置 一 个 6 秒 钟 
的 睡眠 。 

图 15-31 给 出 了 我 们 的 服务 器 过 程 以 及 它 的 线程 取消 处 理 程序 。 

回想 8.5 节 中 就 线程 取消 功能 的 讨论 以 及 随 图 15-23 进 行 的 相关 讨 
论 。 当 系统 检测 到 客户 在 其 door_call 调 用 仍然 进展 期 间 即 将 终止 时 ， 就 
问 处 理 该 调用 的 服务 器 线程 发 送 一 个 取消 请 求 。 





如 果 该 服务 器 线程 禁止 了 取消 功能 ， 那 就 什么 事情 都 不 发 生 ， 该 线 

继续 执行 到 完毕 (调用 door_return 之 时 ) ， 结 果 则 被 丢弃 。 

如 果 该 服务 器 线程 启用 了 取消 功能 ， 那 就 调用 所 设置 的 任何 清理 处 
理 程序 ， 该 线程 随后 终止 。 

在 图 15-31 给 出 的 服务 器 过 程 中 ， 我 们 首先 调用 
pthread_setcancelstate 以 启用 线程 取消 功能 ， 因 为 门 函数 库 创 建新 线程 时 
禁止 该 功能 。 该 函数 还 在 变量 oldstate 中 保存 当前 的 取消 状态 ， 以 便 在 本 
函数 尾 恢复 状态 。 我 们 然后 调用 pthread_cleanup_push 以 把 函数 
servproc_cleanup 注 册 为 取消 处 理 程序 。 该 函数 只 是 输出 本 线程 已 被 取消 
的 消息 ， 不 过 这 儿 正 是 其 服务 器 过 程 在 客户 过 早 终 止 后 做 必要 的 清理 工 
YE SQW RM Ee. SHS AR Hide, SS) 的 地 方 。 当 清理 
处 理 程 序 返 回 时 ， 本 线程 即 终止 。 

我 们 还 在 服务 器 过 程 中 放置 了 一 个 6 秒 钟 的 睡眠 ， 以 允许 客户 在 其 
door_call 调 用 仍 在 进展 期 间 中 止 。 











doors/serverintr4.c 





1 #include "unpipc.h" 
2 void 
3 servproc cleanup(void *arg) 
& 4 
5 printf("servproc cancelled, thread id $1dWMn", pr thread id (NULL) ); 
6 } 
7 void 
8 servproc(void *cookie, char *dataptr, size_t datasize, 
9 door desc t *descptr, size t ndesc) 
10 ( 
T int oldstate, junk; 
12 long arg, result; 
13 Pthread_setcancelstate (PTHREAD CANCEL ENABLE, &oldstate) ; 
14 pthread_cleanup_push(servproc_cleanup, NULL) ; 
15 sleep (6) ; 
16 arg = *((long *) dataptr); 
17 result - arg * arg; 
18 pthread cleanup pop(0); 
19 Pthread setcancelstate(oldstate, &junk); 
20 Door return((char *) &result, sizeof(result), NULL, 0); 
21 } 


doors/serverintr4.c 





图 15-31 检测 客户 过 早 终止 的 服务 器 过 程 





运行 客户 程序 两 次 ， 我 们 看 到 当 它 们 的 进程 被 SIGALRM 信 号 所 杀 
灭 时 ，shell 和 输出 了 “Alarm Clock (FREI gp) “YE 

solaris % clientintr4 /tmp/door4 44 

Alarm Clock 

solaris % clientintr4 /tmp/door4 44 

Alarm Clock 

查看 相应 的 服务 器 输出 ， 我 们 看 到 每 次 有 客户 过 早 终止 时 ， 服 务 器 
线程 确实 被 取消 ， 清 理 处 理 程序 也 被 调用 。 


solaris % serverintr4 /tmp/door4 





servproc canceled,thread id 4 

servproc canceled,thread id 5 

我 们 运行 客户 程序 两 次 是 为 了 展示 ， 当 ID 为 4 的 线程 被 取消 后 ， 门 
函数 库 创建 了 一 个 新 线程 来 处 理 客 户 的 第 二 个 服务 器 过 程 激 活 请 求 。 











15.12 小 结 


门 提供 了 调用 同一 台 主 机 上 男 一 个 进程 中 某 个 过 程 的 能 力 。 下 一 章 

中 我 们 将 对 这 种 远程 过 程 调 用 概念 加 以 扩展 ， 讲 述 如 何 调用 另 一 台 主 机 
上 男 一 个 进程 中 的 某 个 过 程 。 

基本 的 API 函 数 比 较 简 单 。 服 务 器 调用 door_create 创 建 一 个 门 ， 并 
给 它 关 联 一 个 服务 器 过 程 ， 然 后 调用 fattach 给 该 门 附 接 一 个 文件 系统 中 
的 路 径 名 。 PE HM GM ODED 然后 调用 door_call 以 调用 服务 器 
进程 中 的 服务 器 过 程 。 该 服务 器 过 程 通过 调用 door_return 返 回 。 

通常 情况 下 ， 对 一 个 门 所 执行 的 唯一 权限 测试 是 由 open 函 数 在 打开 
该 门 时 进行 的 ， 这 种 测试 基于 客户 的 用 户 ID 和 组 ID 以 及 该 门 的 路 径 名 的 
权限 位 和 属 主 / 属 组 ID。 AU A 
精妙 特性 ， 即 服务 器 具有 确定 客户 的 凭证 的 能 力 ， 这 些 赁 证 包括 客户 的 











有 效用 户 ID 和 实际 用 户 ID 以 及 有 效 组 ID 和 实际 组 ID 。 服 务 器 可 使 用 这 
些 信 息 来 确定 自己 是 否 想 给 相应 客户 的 请 求 提 供 服务 。 

门 允 许 从 客户 回 服务 器 以 及 从 服务 器 回 客 户 传递 描述 符 。 这 是 一 个 
非常 有 用 的 技巧 ， 因 为 Unix 中 描述 符 代 表 关 许多 访问 手段 : 访问 文件 以 
进行 文件 或 设备 IO， 访 问 套 接 字 或 XTI 以 进行 网 络 通信 CUNPv1) ， 访 
问 门 以 进行 远程 过 程 调 用 。 

调用 另 一 个 进程 中 的 过 程 时 ， 我 们 必须 考虑 对 端的 过 早 终止 ， 这 是 
本 地 过 程 调用 所 不 必 担 心 的 问题 。 如 果 门 服务 器 线程 过 早 终止 ， 其 客户 
通过 由 door_call 返 回 一 个 EINTR 错 误 得 以 通知 。 如 果 门 客户 在 其 
door_call 调 用 仍 在 进展 期 间 终止 ， 其 服务 器 线程 承 通 过 接收 一 个 线程 取 
消 请 求 得 到 通知 。 该 服务 器 线程 必须 确定 是 否 处 理 这 个 取消 请 求 。 

















习题 








15.1 由 door_call 作 为 参数 从 客户 传递 给 服务 器 的 信息 有 多 少 字 市 ? 

15.2 在 图 15-6 中 ， 有 必要 首先 调用 fstat 以 验证 所 打开 的 描述 符 是 一 
个 门 吗 ? 去掉 这 个 调用 ， 看 一 看 发 生 了 什么 。 

15.3 Solaris ”2.6 中 sleep(3C) 的 手册 页 面 这 么 陈述 : “The current 
process is suspended from exection. (当前 进程 从 执行 状态 挂 起 。) ”在 图 
15-9 中 ， 既 然 这 人 句 话 意 味 着 一 旦 有 一 个 线程 调用 sleep， 整 个 服务 器 进程 
即 阻塞 ， 那 么 为 什么 在 第 一 个 线程 (ID 为 4) 开始 运行 后 ， 门 函数 库 仍 
能 创建 第 二 个 和 第 三 个 线程 (ID 为 5 和 6) 呢 ? 

15.4 在 15.3 节 中 我 们 说 过 ， 对 于 使 用 door_create 创 建 的 描述 符 ， 它 
们 的 FD_CLOEXEC 位 是 自动 设置 的 。 然 而 我 们 可 以 在 door_create 返 回 
后 ， 调 用 fcntl 把 该 位 天 掉 。 如 果 我 们 这 么 做 后 调用 exec， 再 从 茶 个 客户 
中 激活 服务 器 过 程 ， 将 发 生 什么 ? 

15.5 在 图 15-28 和 图 15-29 中 ， 将 客户 程序 和 服务 器 程序 各 目的 两 个 

















printf 调 用 改 为 输出 当前 时 间 。 运 行 这 两 个 程序 。 为 什么 第 一 次 激活 服 
务 器 过 程 在 2 秒 后 返回 ? 

15.6 把 图 15-22 和 图 15-23 中 保护 fd 的 互 斥 锁 去 掉 ， 验 证 程序 不 再 正 
确 工作 。 你 看 到 了 什么 错误 ? 

15.7 如 果 我 们 想 要 改变 的 唯一 的 服务 器 线程 特性 是 启用 取消 ， 那 么 
需要 建立 一 个 服务 器 创建 过 程 吗 ? 

15.8 验证 door_revoke 人 多 许 已 在 进行 的 客户 调用 继续 完成 ， 并 确定 服 
务 器 过 程 被 取消 后 door_call 的 执行 情况 。 

159 ”在 上 一 道 习题 的 解答 以 及 图 15-22 中 我 们 说 过 ， 当 服务 絮 过 程 
或 服务 器 创建 过 程 需 使 用 门 描述 符 时 ， 它 必须 是 一 个 全 局 变量 。 这 种 说 
法 并 不 正确 。 重 新 编写 上 一 道 习 题解 答 的 程序 ， 让 和 作为 main 函 数 中 的 
—^ ASAE E. 

15.10 在 图 15-23 中 ， 我 们 每 次 创建 一 个 线程 都 得 调用 
pthread_attr_init 和 pthread_attr_destroy。 这 样 做 是 最 佳 的 吗 ? 
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第 16 = Sun RPC 


16.1 概述 


构筑 一 个 应 用 程序 时 ， 我 们 首先 在 以 下 两 者 之 间作 出 选择 : 

(构筑 一 个 庞大 的 单一 程序 ， 完 成 全 部 工作 ; 

(2) 把 整个 应 用 程序 散布 到 彼此 通信 的 多 个 进程 中 。 

如 有 果 我 们 选择 后 者 ， 接 下 去 的 择 决 是 : 

2a) 假 设 所 有 进程 运行 在 同一 台 主 机 上 (允许 IPC 用 于 这 些 进程 间 的 
通信 ) 

2b) 假 设 某 些 进程 会 运行 在 其 他 主机 上 《要求 使 用 进程 间 某 种 形式 
的 网 络 通信 ) 

在 图 15-1 中 ， 顶 部 的 情形 是 选择 1， 中 部 的 情形 是 选择 2a， 底 部 的 
情形 是 选择 2b。 本 书 的 大 部 分 关注 的 是 2a 这 种 情况 ， 也 就 是 使 用 消息 传 
递 、 共 享 内 存 区 ， 并 可 能 使 用 某 种 形式 的 同步 来 进行 同一 人 台 主 机 上 的 进 
程 间 IPC。 同 一 进程 内 不 同 线程 间 的 IPC 以 及 不 同 进程 内 各 个 线程 间 的 
IPC 只 是 这 种 情形 的 特殊 情况 。 

不 同 部 分 之 间 需 要 网 络 通信 的 应 用 程序 大 多 数 是 使 用 显 式 网 络 编程 
(explicit network programming) 方式 编写 的 ， 也 承 是 如 UNPvl 中 讲述 的 
那样 直接 调用 套 接 字 API 或 XTI API。 使 用 套 接 字 API 时 ， 客 户 调用 
socket、connect、read 和 write， 服 务 器 则 调用 socket、bind、listen、 
n read 和 write。 我 们 熟悉 的 大 多 数 应 用 程序 (Web 浏览 器 、Web 服 

器 、Telnet 客 户 、Telnet 服 务 器 等 程序 ) 就 是 以 这 种 方式 编写 的 。 

编写 分 布 式 应 用 程序 的 男 一 种 方式 是 使 用 隐 式 网 络 编程 (implicit 
network programming) 。 远 程 过 程 调 用 (RPC) 提供 了 这 样 的 一 个 工 











有 具 。 我 们 使 用 早已 熟悉 的 过 程 调用 来 编写 应 用 程序 ， 但 是 调用 进程 〈 客 
P) 和 含有 被 调用 过 程 的 进程 《服务 器 ) 可 在 不 同 的 主机 上 执行 。 客 户 
和 服务 器 运行 在 不 同 的 主机 上 而 且 过 程 调用 中 涉及 网 络 VO， 这 样 的 事 
实 对 于 程序 员 基本 上 是 透明 的 。 事 实 上 衡量 一 个 RPC 软 件 包 的 测度 之 一 
就 是 它 能 使 作为 底层 支撑 的 网 络 WO 对 程序 员 的 透明 度 有 多 大 。 

16.1.1 例子 

作为 RPC 的 一 个 例子 ， 我 们 把 图 15-2 和 图 15-3 重 新 编写 成 改 用 Sun 
RPC 代 蔡 门 。 客 户 以 一 个 长 整数 调用 服务 器 的 过 程 ， 返 回 值 则 是 该 值 的 
平方 。 图 16-1 给 出 了 我 们 的 第 一 个 文件 square.x。 

其 名 字 以 .x 结尾 的 文件 称 为 RPC 说 明 书 文件 (RPC specification 
file) ， 它 们 定义 了 服务 器 过 程 以 及 这 些 过 程 的 参数 和 结果 。 

定义 参数 和 返回 值 

1~6 定义 两 个 结构 ， 一 个 用 于 参数 〈 其 成 员 为 单个 long 变 量 ) , A 
一 个 用 于 结果 《其 成 员 为 单个 long 变 量 ) 。 





sunrpc/squarel/square.x 





1 struct square in { /* input (argument) */ 
2 long argl; 

3 E 

4 struct square out ( /* output (result) */ 
5 long resl; 


6 }; 


7 program SQUARE PROG { 


8 version SQUARE VERS { 

9 square out  SQUAREPROC(square in) - 1; /* procedure number - 1 */ 
10 } = To /* version number */ 

11) = 0x31230000; /* program number */ 


sunrpc/squarel/square.x 








图 16-1 RPC 说 明 书 文件 

定义 程序 、 版 本 和 过 程 

7~11 ”定义 一 个 名 为 SQUARE_PROG 的 RPC 程 序 ， 它 由 一 个 版 本 
(SQUARE VERS) 构成 ， 该 版 本 中 又 定义 了 单个 名 为 SQUAREPROC 
的 过 程 。 该 过 程 的 参数 是 一 个 square_in 结 构 ， 其 返回 值 则 是 一 个 





square_out 结 构 。 我 们 还 给 该 过 程 赋 了 一 个 值 为 1 的 过 程 号 ， 给 版 本 赋 的 
值 为 1， 给 程序 号 赋 的 是 一 个 32 位 十 六 进 制 值 〈 我 们 将 在 图 16-9 中 详细 
讨论 程序 号 ) 。 

我 们 使 用 一 个 随 Sun ”RPC 软件 包 提 供 的 程序 来 编译 这 个 说 明 书 文 
件 ， 访 程序 就 是 rpc_gen。 

我 们 编写 的 下 一 个 程序 是 调用 我 们 的 远程 过 程 的 客户 程序 main 函 
数 。 图 16-2 给 出 了 该 函数 。 











sunrpc/squarel/client.c 


1 #include "unpipc.h" /* our header */ 
2 #include "square.h" /* generated by rpcgen */ 
3. amt. 


4 main(int argc, char **argv) 


6 CLIENT *cl; 
7 square in in; 
8 Square out *outp; 
9 dif (arge: s.3) 
10 err quit("usage: client «hostname» «integer-value»"); 
dr cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 in.argl - atol(argv[21); 
13 if ( (outp = squareproc_1(&in, cl)) == NULL) 
14 err quit("$s", clnt sperror(cl, argv[1])); 
15 printf("result: $1dWMn", outp-»res1); 
16 exit (0); 
17 ) 


sunrpc/squarel/client.c 





图 16-2 调用 远程 过 程 的 客户 程序 main 函 数 

包括 进 由 rpcgen 生 成 的 头 文件 

2 #include Hrpcgeny” ^E fJsquare.h 3 SF 

声明 客户 句柄 

6 我 们 声明 一 个 名 为 al 的 客户 句柄 〈client handle) 。 客 户 句 柄 意图 
看 起 来 像 标 准 JO 的 FILE 指 针 《 因 而 有 全 为 大 写 的 名 字 CLIENT) 。 

获取 客户 句柄 

11 我 们 调用 clnt_create， 它 运行 成 功 时 返回 一 个 客户 句柄 。 


#include <rpc/rpc.h> 














CLIENT *clnt_create(const char *host,unsigned long program, 
unsigned long versnum,const char *protocol); 
返回 : 大 成 功 则 为 非 空 客户 句柄 ， 硅 出错 则 为 
NULL 

与 标准 IO 的 FILE 指 针 一 样 ， 我 们 并 不 关心 客户 句柄 指 癌 什么 内 
容 。 它 可 能 是 由 RPC 运 行 时 系统 维护 的 某 个 信息 结构 。clnt_create 分 配 
一 个 这 样 的 结构 ， 并 返回 指向 它 的 指针 ， 以 后 每 次 调用 一 个 远程 过 程 
时 ， 我 们 就 把 该 指针 传递 给 RPC 运 行 时 系统 。 

clnt_create 的 第 一 个 参数 既 可 以 是 运行 我 们 的 服务 器 的 主机 的 主机 
名 ， 也 可 以 是 它 的 耳 地 址 。 第 二 个 参数 是 程序 名 ， 第 三 个 参数 是 版 本 
号 ， 这 两 者 都 来 自我 们 的 square.x 文 件 〈“ 图 16-1) 。 最 后 一 个 参数 是 我 们 
的 协议 选择 ， 通 常 指 定 为 TCP 或 UDP。 

调用 远程 过 程 并 输出 结果 

12—15 ”调用 我 们 的 远程 过 程 ， 其 中 第 一 个 参数 是 指向 输入 结构 的 
Het (&in) ， 第 二 个 参数 是 所 获取 的 客户 句柄 。 (在 大 多 数 标准 VO 调 
用 中 ，FILE 人 句柄 是 最 后 一 个 参数 。 类 似 地 ， ”RPC 函数 的 最 后 一 个 参数 
通常 为 CLIENT 句柄 。) 返回 值 是 指 同 结果 结构 的 指针 。 注 意 ， 我 们 给 
输入 结构 分 配 了 空间 ， 但 是 结果 结构 是 由 RPC 运 行 时 系统 分 配 的 。 

在 square.x 说 明 书 文件 中 ， 我 们 称 远 程 过 程 为 SQUAREPROC， 但 是 
在 客户 程序 中 ， 我 们 称 它 为 squareproc_1。 这 儿 的 约定 是 : .x 文件 中 的 名 
字 转 换 成 小 写字 母 形 式 ， 添 上 一 个 底 划 线 后 跟 以 版 本 号 。 

在 服务 器 方 ， 我 们 只 编写 服务 器 过 程 ， 如 图 16-3 所 示 。 服 务 器 程序 
的 main 函 数 由 rpc_gen 程 序 自动 生成 。 





























sunrpc/squarel/server.c 





1 include "unpipc.h" 
2 #include "square.h" 


3 square out * 

4 squareproc 1 svc(square in *inp, struct svc req *rqstp) 
5 { 

6 static square out out; 

i out.resl = inp->argl * inp->argl; 

8 

9 


return (&out) ; 


} 


sunrpc/squarel/server.c 





图 16-3 使 用 Sun RPC 调 用 的 服务 器 过 程 





过 程 参数 

3 一 4 我 们 首先 注意 到 服务 器 过 程 的 名 字 在 版 本 号 后 添加 了 _svc。 这 
样 允许 square.h 头 文件 中 有 两 个 ANSI “C 函 数 原 型 ， 一 个 是 图 16-2 中 由 客 
户 调用 的 函数 〈 它 的 一 个 参数 是 客户 句柄 ) ， 另 一 个 是 实际 的 服务 器 函 
数 《 它 使 用 的 参数 与 由 客户 调用 的 函数 不 一 样 ) 。 

当 我 们 的 服务 器 过 程 被 调用 时 ， 传 递 给 它 的 第 一 个 参数 是 指向 输入 
结构 的 指针 ， 第 二 个 参数 是 指向 由 RPC 运 行 时 系统 传递 的 一 个 结构 的 指 
针 ， 该 结构 含有 关于 这 次 激活 的 信息 (我 们 这 个 简单 的 过 程 忽略 了 这 些 
Fils) s 

执行 并 返回 

6 一 8 ”取出 输入 参数 并 计算 其 平方 值 。 该 结果 存放 在 一 个 结构 中 ， 
而 该 结构 的 地 址 则 作为 本 函数 的 返回 值 。 Pp UE 数 中 返回 一 
个 变量 的 地 址 ， 因 为 该 变量 不 能 是 一 个 自动 变量 。 我 们 把 它 声明 为 static 
变量 。 

机 敏 的 读者 将 注意 到 ， 这 样 做 妨碍 服务 器 函数 成 为 线程 安全 函数 。 
我 们 将 在 16.2 节 中 讨论 这 一 点 ， 并 给 出 一 个 线程 安全 的 版 本 。 

现在 在 Solaris 下 编译 我 们 的 客户 程序 ， 在 BSD/OS 下 编译 我 们 的 服 
务 嚣 程序， 启动 服务 器 ， 然 后 运行 客户 程序 


solaris % client bsdi 11 

















result: 121 

solaris % client 209.75.135.35 22 

result: 484 

第 一 次 运行 时 我 们 指定 服务 器 主机 的 主机 名 ， 第 二 次 运行 时 指定 它 
的 耳 地 址 。 这 表明 客户 程序 调用 的 clnt_create 函 数 以 及 RPC 运 行 时 函数 都 
是 既 人 允许 使 用 主机 名 ， 也 人 允许 使 用 耳 地 址 。 

接着 展示 服务 器 主机 不 存在 或 者 尽管 存在 但 没有 运行 我 们 的 服务 器 
程序 时 ， 由 clnt_create 返 回 的 一 些 错 误 。 

solaris % client nosuchhost 11 

nosuchhost: RPC: Unknown host 出 自 RPC 运 行 时 系统 

clnt_create error 出 自我 们 的 包 于 函数 


solaris % client localhost 11 








localhost: RPC: Program not registered 

clnt_create error 

我 们 已 编写 了 一 个 客户 程序 和 一 个 服务 器 程序 ， 并 展示 了 其 中 没有 
使 用 任何 显 式 的 网 络 编程 方式 。 我 们 的 客户 程序 只 是 调用 两 个 函数 
(cInt. createfilsquareproc 1) ， 而 在 服务 器 方 ， 我 们 只 是 编写 
squareproc_1_svc 函 数 。 涉 及 Solaris 下 的 XTI、BSD/OS 下 的 套 接 字 以 及 网 
络 WO 的 所 有 细节 都 由 RPC 运 行 时 系统 来 处 理 。 这 就 是 RPC 的 目的 : 不 需 
要 显 式 的 网 络 编程 知识 就 允许 编写 分 布 式 应 用 程序 。 

本 例子 的 另 一 个 重要 之 处 在 于 ， 所 用 的 两 个 系统 《运行 Solaris 的 
Sparc 系 统 和 运行 BSD/OS 的 Intel x86 系 统 ) 具有 不 同 的 字 节 序 (byte 
order) 。 其 中 Sparc 系 统 是 大 端 (big endian) 字 节 序 ， Intel 系 统 是 小 端 

(little endian) 字 节 序 〈 我 们 在 UNPv1 的 3.4 节 中 展示 了 这 两 种 字 节 

HO 。 这 些 字 节 排序 上 的 差异 也 是 由 运行 时 函数 库 自 动 处 理 的 ， 其 中 使 
用 了 一 个 称 为 XDR (external data representation， 外 部 数据 表示 ) 的 标 
准 ， 我 们 将 在 16.8 节 中 讨论 。 








本 例子 中 客户 程序 和 服务 器 程序 的 构建 所 涉及 的 步骤 比 本 书 中 其 他 
程序 的 构建 都 要 多 。 下 面 是 构建 客户 程序 可 执行 文件 所 涉及 的 步 又: 


solaris % rpcgen -C Square.X 





solaris % cc -c client.c -o client.o 

solaris % cc -c square_clnt.c -o square_clnt.o 

solaris 96 cc -c square xdr.c -o square xdr.o 

solaris 96 cc -o client client.o square clnt.o square xdr.o libunpipc.a - 
Ins] 

其 中 mpcgen 的 -C 选 项 告诉 它 在 square.h 头 文件 中 生成 ANSI CHH, 
rpcgen 还 产生 一 个 称 为 客户 程序 存根 〈client stub) 的 源 文件 square_clnt.c 
和 一 个 名 为 square_xdr.c 的 用 来 处 理 XDR 数 据 转 换 的 文件 。libunpipc.a 是 
我 们 的 函数 库 〈 存 放 本 书 中 所 用 的 函数 ) ，-Insl 选 项 则 指定 Solaris 下 存 
放 网 络 支撑 函数 〈 包 括 RPC 和 XDR 运 行 时 系统 ) 的 系统 函数 库 。 

构建 服务 器 程序 时 我 们 会 看 到 类 似 的 命令 ， 不 过 rpcgen 不 必 再 运 
行 。 文 件 square_svc.c 中 含有 服务 器 程序 main 函 数 ， 另 外 ， 构 建 客 户 程序 
时 生成 的 含有 XDR 函 数 的 square_xdr.o 文 件 在 服务 器 程序 的 构建 中 也 需 


EH 








solaris 96 cc -c server.c -0 server.o 

solaris 96 cc -c square svc.c -0 square svc.o 

solaris 96 cc -0 server server.o square svc.o square xdr.o libunpipc.a - 
Ins] 

这 样 会 生成 都 运行 在 Solaris 下 的 客户 程序 和 服务 器 程序 。 

当 客 户 程序 和 服务 器 程序 是 为 不 同 的 系统 构建 时 《例如 在 我 们 早 移 
的 例子 中 ， 客 户 程序 运行 在 Solaris 下 ， 服 务 器 程序 运行 在 BSD/OS 
PO ， 可 能 需要 额外 的 步骤 。 举 例 来 说 ， 茶 些 文件 必须 共享 《例如 通过 
NFS) 或 者 在 两 个 系统 之 间 复 制 ， 男 外 ， 客 户 程 序 和 服务 强 程 序 都 使 用 
的 文件 (square_xdr.o〉 必须 在 每 个 系统 上 分 别 编译 。 




















图 16-4 汇 总 了 构建 我 们 的 客户 -服务 器 例子 程序 所 需 的 文件 和 步骤 。 
其 中 三 个 带 阴 影 的 方 框 是 我 们 必须 编写 的 文件 。 短 划 线 指出 了 需要 C 伪 
指令 #include square.h 的 那些 文件 。 
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图 16-4 构建 一 个 RPC 客 户 - 服 务 器 程序 所 需 的 步骤 汇总 


图 16-5 汇 总 了 一 次 远程 过 程 调 用 中 通 弟 发 和 后 的 步骤 。 编 了 号 的 步 又 
是 按 顺 序 执行 的 。 

(0) 服 务 器 启动 ， 它 同 所 在 主机 上 的 端口 映射 器 (port mapper) 注册 
自 映 。 然 后 客户 启动 ， 它 调用 clnt_create， 该 函数 则 与 服务 器 主机 上 的 
羔 口 映射 器 联系 ， 以 找到 服务 器 的 临时 端口 。dlnt_create 函 数 还 建 六 一 
个 与 服务 器 的 TCP 连 接 et a 。 我 
们 在 本 图 中 没有 展示 这 些 步骤 ， 留 待 16.3 节 中 详细 地 讲述 。 

() 客 户 调 用 一 个 称 为 客户 程 ) ee (client stub) 的 本 地 过 程 。 在 
图 16-2 中 ， 该 过 程 名 为 squareproc_1， 而 含有 这 个 客户 程序 存根 的 文件 
是 由 rpcgen 产 生 的 ， 名 为 square_clnt.c。 对 于 客户 来 说 ， 客 户 程序 存根 看 





























起 来 像 是 它 想 要 调用 的 真正 的 服务 器 过 程 。 存 根 的 目的 在 于 把 有 待 传递 
给 远程 过 程 的 参数 打 成 包 ， 可 能 的 话 把 它们 转换 成 某 种 标准 格式 ， 然 后 
构造 一 个 或 多 个 网 络 消息 。 把 客户 提供 的 参数 打包 成 一 个 网 络 消 妃 的 过 
程 称 为 集结 (marshaling) 。 客 户 程 序 的 各 个 例 程 和 存根 通常 调用 RPC 
运行 时 函数 库 中 的 函数 (例如 我 们 早先 的 例子 中 的 clnt_create〉。 在 
Solaris 下 链接 时 ， 这 些 运 行 时 库 函 数 是 从 _lns] 函 数 库 中 加 载 的 ， 而 
BSD/OS 下 它们 是 在 标准 C 函 数 库 中 。 
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(3)= 网 络 通信 
图 16-5 一 次 远程 过 程 调 用 中 涉及 的 步骤 

(2) 这 些 网 络 消息 由 客户 程序 存根 发 送 给 远程 系统 。 这 通常 需要 一 次 
陷入 本 地 内 核 的 系统 调用 (例如 write 或 sendto) 。 

(3) 这 些 网 络 消息 传送 到 远程 系统 。 这 一 步 所 用 的 典型 网 络 协议 为 
TCP 或 UDP。 

(4) 一 个 服务 器 程序 存根 (sever stub) 过程 一 直 在 远程 系统 上 等 待 客 
户 的 请 求 。 它 从 这 些 网 络 消息 中 解散 Cunmarshaling) 出 参数 。 

(5) 服 务 器 程序 存根 执行 一 个 本 地 过 程 调用 以 激活 真正 的 服务 器 函数 
〈 图 16-3 中 我 们 的 squareproc_1_svc 过 程 ) ， 传 递 给 该 函数 的 参数 是 它 从 














来 自 客户 的 网 络 消息 中 解散 出 来 的 。 

(6) 当 服务 器 过 程 完成 时 ， 它 同 服 务 器 程序 存根 返回 其 返回 值 。 

(7) 服 务 器 程序 存根 在 必要 时 对 返回 值 进行 转换 ， 然 后 把 它们 集结 到 
一 个 或 多 个 网 络 消息 中 ， 以 便 发 送 回 客 户 。 

(8) 这 些 消息 通过 网 络 传送 回 客 户 。 

(9) 客 户 程序 存根 从 本 地 内 核 中 读 出 这 些 网 络 消 息 〈 例 如 read 或 
recvfrom) 。 

(10) 对 返回 值 进 行 可 能 的 转换 后 ， 客 户 程序 存根 最 终 返 回 客户 函 
数 。 这 一 步 看 起 来 像 是 一 个 普通 的 过 程 返 回 客户 。 

16.1.2 历史 

关于 RPC 的 最 早期 论文 之 一 也 许 是 [White 1975] 。 按 照 [Corbin 
1991] 的 陈述 ，White 当 时 转 到 了 Xerox〈 施 乐 ) 公司 ， 那 儿 于 是 开发 了 
若干 个 RPC 系 统 。 其 中 之 一 的 Courier 是 于 1981 年 面世 的 一 个 产品 。 关 于 
RPC 的 经 典 论文 是 [Birrell and Nelson 1984] ， 它 讲述 了 20 世 纪 80 年 代 
早期 在 Xerox 公 司 的 Dorado 单 用 户 工 作 站 上 运行 的 Cedar 项 目的 RPC 机 
制 。Xerox 在 大 多 数 人 还 不 知道 工作 站 是 什么 的 时 候 就 打算 在 工作 站 上 
实现 RPC 了 !Courier 的 一 个 Unix 实 现 版 本 随 4.x BSD 各 个 发 行 版 本 传播 了 
许多 年 ， 不 过 现今 Courier 只 具有 历史 意义 了 。 

Sun 公 司 于 1985 年 发 行 它 的 RPC 软 件 包 的 第 一 个 版 本 。 它 是 由 Bob 
Lyon 开 发 的 ，Bob 于 1983 年 离开 Xerox 加 入 Sun。 它 的 正式 名 字 是 
ONC/RPC: Open Network Computing Remote Procedure Call (开放 的 网 
络 计算 远程 过 程 调用 ) ， 不 过 往往 被 称 为 “Sun RPC”. REE, ER 
似 于 Courier。Sun = RPC 的 初期 版 本 是 用 套 接 字 API 编 写 的 ， 既 能 用 于 
TCP， 也 能 用 于 UDP。 公 开 可 得 的 源 代码 版 本 称 为 RPCSRC。20 志 纪 90 
年 代 早 期 ，Sun RPC 改 用 TLI API 重 新 编号， 能 用 于 内 核 支 持 的 任何 网 络 
协议 ， 其 中 TLI 是 XTI《〈 在 UNPv1 第 四 部 分 讲述 ) 的 前 身 。 套 接 字 版 本 
和 TLI 版 本 的 公开 可 得 源 代 码 实现 都 可 从 




















ftp: //playground.sun.com/pub/rpc 中 获得 ， 前 者 的 名 字 为 rpcsrc， 后 者 的 
名 字 为 tirpcsrc〔 称 为 TIT-RPC， 其 中 “TI 代表 “传输 独 六 (transport 
independent) ”) 。 

RFC 1831 [Srinivasan 1995a] 提供 了 Sun RPC 的 一 个 概 狐 ， 并 描述 
了 通过 网 络 发 送 的 RPC 消 息 的 格式 。RFC 1832 [Srinivasan 1995b ] 讲述 
了 XDR， 既 包括 所 文 持 的 数据 类 型 ， 又 包括 它们 的 “在 线 上 (on the 
wire) ”格式 。RFC 1833 [Srinivasan 1995c] 讲述 了 捆绑 协议 : 
RPCBIND 及 其 前 刁 端口 映射 器 。 

使 用 Sun RPC 的 最 广泛 流行 的 应 用 也 许 是 NFS， 即 Sun 的 网 络 文件 系 
统 。 正 常情 况 下 ，NFS 不 是 使 用 本 章 讲 述 的 标准 RPC 工 具 、rpcgen 以 及 
RPC 运 行 时 函数 库 构造 的 。 相 反 ， 它 的 大 多 数 库 例 程 是 手工 优化 过 的 ， 
并 且 因 性 能 原因 而 驻 留 在 内 核 中 。 然 而 文 持 NFS 的 大 多 数 系统 也 文 持 
Sun RPC. 

20 世 纪 80 年 代 中 期 ，Appollo 公 司 与 Sun 在 工作 站 市 场 展开 竞争 ， 并 
自行 设计 了 称 为 NCA (Network Computing Architecture， 网 络 计算 体系 
结构 ) 的 RPC 软 件 包 与 Sun ”RPC 一 较 高 下 ， 其 实现 称 为 NCS (Network 
Computing System， 网 络 计算 系统 ) 。NCA/RPC 是 RPC 协 议 ， 
NDR (Network Data Representation, WAGER) 类 似 于 Sun 的 
XDR, NIDL (Network Interface Definition Language， 网 络 接口 定义 语 
言 ) 则 定义 了 客户 和 服务 器 之 间 的 接口 〈 例 如 类 似 于 图 16-1 中 的 .x 文 
件 ) 。 运 行 时 函数 库 称 为 NCK (Network Computing Kernel， 网 络 计 算 
内 核 ) 。 

Apollo 于 1989 年 被 Hewlet.Packard (惠普 ) 公司 收购 ，NCA 于 是 发 
展 成 为 开放 软件 基金 会 (OSF) 的 分 布 式 计 算 环境 
(Distribute.Computin.Environment, DCE) ， 其 中 RPC 是 一 个 基本 元 
系 ， 大 多 数 部 件 就 构建 在 其 上。 有关 DCE 的 详细 信息 可 从 
http://www.camb.opengroup.org/tech/dce 中 得 到 。DC.RPC 软 件 包 有 一 个 




















实现 是 公开 可 得 的 ， 其 URL 为 ftp://gatekeeper.dec.com/pub/DEC/DCE。 
该 目录 还 含有 一 个 171 页 的 文档 ， 讲 述 DC.RPC 软 件 包 的 内 部 工作 原理 。 
许多 平台 上 有 DCE 可 用 。 

Sun RPC 比 DCE RPC 要 流行 得 多 ， 其 原因 也 许 是 前 者 有 免费 可 得 的 
实现 ， 而 且 大 多 数 版 本 的 Unix 把 Sun RPC 软 件 包 作 为 基本 系统 的 一 部 分 
提供 。DCE RPC 通 常 是 作为 一 个 增值 (也 就 意味 着 单独 计价 ) 特性 提供 
的 。 它 的 公开 可 得 实现 并 没有 得 到 广泛 的 移植 ， 尽 管 往 Linux 上 的 移植 
正在 进展 中 。 本 书 中 我 们 只 讨论 Sun RPC. Courier, Sun RPC 和 DCE 
RPC 这 三 个 RPC 软 件 包 都 极其 相似 ， 因 为 基本 的 RPC 概 念 是 一 样 的 。 

大 多 数 Unix 厂 家 提供 关于 Sun RPC 的 除 手 册页 面 外 的 详细 文档 。 举 
例 来 说 ，Sun 的 文档 可 从 http://docs.sun.com 获 取 ， 在 “Developer 
Collection 《开发 人 员 资 料 汇编 ) ”第 1 卷 中 ， 它 是 名 
为 "ONC+DeveloperS Guide CONC+ 开 发 人 员 指 南 ) ”的 共 280 页 的 一 个 
部 分 。Digital Unix 的 文档 可 从 
http://www.u nix.digital.com/faqs/publications/pub page/V40D DOCS.HT^ 
获取 ， 包 括 一 本 题目 为 "Programming with ONC RPC (f£ HONC RPC 编 
程 ) ”的 116 页 手册 。 

RPC 本 号 是 一 个 让 人 争议 的 主题 。http:/www.kohala.com/ 一 
rstevens/papers.others/rpc.comments.txt 中 收集 了 关于 这 个 主题 的 8 篇 文 
Eo 

本 章 中 我 们 假设 给 大 多 数 例子 使 用 TI-RPC 〈 早 先 提 及 的 传输 独立 版 
本 的 RPC) ， 其 中 TCP 和 UDP 作 为 TI-RPC 支 持 的 协议 讨论 ， 不 过 TI-RPC 
能 够 文 持 主机 所 能 文 持 的 任何 协议 。 


16.2 多 线程 化 


回想 图 15-9， 我 们 从 中 展示 了 由 门 服务 器 执行 的 自动 线程 管理 ， 由 

















此 默认 提供 了 一 个 并 发 服务 器 。 我 们 现在 展示 Sun RPC 默 认 提 供 的 是 一 
个 迭代 服务 器 (iterative server) 。 我 们 从 上 一 节 中 的 例子 程序 着 手 ， 并 
只 修改 其 中 的 服务 器 过 程 。 图 16-6 给 出 了 这 个 新 函数 ， 它 输出 所 在 线程 
的 线程 ID， 睡 虐 5 秒 钟 ， 再 输出 自己 的 线程 DD， 然 后 返回 。 





sunrpc/square2/server.c 
1 #include "unpipc.h" 
2 #include "square .hy 


3 square_out * 
4 squareproc 1 svc(square in *inp, struct svc req *rqstp) 


5 { 


6 static square out out; 
a printf ("thread $1d started, arg = %ld\n", 
8 pr thread id(NULL), inp->arg1) ; 
9 sleep(5); 
10 out.resl = inp->argl * inp-»argl; 
Jil printf ("thread $1d done\n", pr thread id(NULL)); 
12 return(&out); 
13) } 





sunrpc/square2/server.c 


图 16-6 睡眠 5 秒 钟 的 服务 器 过 程 
我 们 启动 服务 器 ， 然 后 运行 客户 程序 三 次 : 
solaris % client localhost 22 & client localhost 33 & \ 
client localhost 44 & 











[3] 25179 

[4] 25180 

[5] 25181 

solaris % result: 484 shell 提 示 符 输出 后 约 5 秒 

result: 1936 男 一 个 5 秒 后 

result: 1089 FAA SSSA 

尽管 区 看 这 些 输出 ， 我 们 不 能 识别 每 个 客户 输出 各 自 的 结果 时 彼此 
间 有 5 秒 钟 的 等 待 发 生 。 然 而 要 是 查看 服务 器 的 输出 ， 我 们 就 会 看 到 各 





个 客户 请 求 是 达 代 地 处 理 的 : 处 理 完 第 一 个 客户 的 请 求 后 ， 接 着 处 理 第 
二 个 客户 的 请 求 丰 到 处 理 完 毕 ， 最 后 是 处 理 第 三 个 客户 的 请 求 丰 到 处 理 


alt 
T 


solaris 96 server 

thread 1 started,arg = 22 

thread 1 done 

thread 1 started,arg = 44 

thread 1 done 

thread 1 started,arg = 33 

thread 1 done 

可 看 出 单个 线程 在 处 理 所 有 的 客户 请 求 : 默认 情况 下 服务 器 并 不 多 
线程 化 。 

第 15 章 中 我 们 的 门 服务 器 程序 从 shell 启 动 时 都 运行 在 前 台 ， 例 如 : 

solaris % server 

这 样 允 许 我 们 在 服务 器 过 程 中 放置 调试 用 的 printf 调 用 。 但 是 Sun 
RPC 服 务 器 默认 作为 守护 进程 运行 ， 也 就 是 执行 了 UNPv1 的 12.4 [5] 
中 概括 出 的 大 干 步 又 。 这 就 要 求 从 服务 占 过 程 中 调用 syslog 来 输出 任何 
诊断 信息 。 然 而 我 们 的 做 法 是 在 编译 服务 器 程序 时 指定 C 编 译 器 标志 - 
DDEBUG， 这 跟 在 服务 器 程序 存根 (由 rpcgen 产 生 的 square_svc.c 文 件 ) 
中 放置 如 下 行 是 等 效 的 : 

#define DEBUG 

这 么 一 来 就 阻止 了 服务 器 程序 main 函 数 将 自身 变 为 一 个 守护 程序 ， 
服务 器 于 是 继续 连接 到 局 动 它 的 终端 上 。 这 就 是 我 们 可 以 从 服务 器 过 程 
中 调用 printf 的 原因 。 

Sun RPC 是 随 Solaris 2.4 提 供 多 线程 化 的 服务 器 的 ， 它 通过 向 rpcgen 
指定 一 个 -M 命 令 行 选项 启用。 这 使 由 rpcgen 产 生 的 服务 器 代码 变 得 线程 
安全 。 男 一 个 选项 -A 是 让 服务 强 根 据 人 处 理 新 客户 请 求 的 需要 上 自动 创建 线 
程 。 我 们 运行 pcgen 时 ， 同 时 使 能 这 两 个 选项 。 

客户 程序 和 服务 器 程序 的 源 代 码 都 需要 修改 ， 这 是 我 们 应 该 预期 到 











的 ， 因 为 我 们 在 图 16-3 中 使 用 了 static 类 型 变量 。 对 square.x 文 件 的 唯一 
改动 是 把 版 本 号 从 1 改 为 2。 服 务 嚣 过程 的 参数 结构 和 结果 结构 的 声明 都 
ANE 

图 16-7 给 出 了 新 的 客户 程序 。 


sunrpc/square3/client.c 





1 #include "unpipc.h" 
2 #include "Square.h" 
3 unt 


4 main(int argc, char **argv) 


6 CLIENT *cl; 

7 square in in; 

8 Square out out; 

9 if (argc != 3) 

10 err quit("usage: client «hostname» <integer-value>") ; 
aial cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 in.argl = atol (argv[2]); 

13 if (squareproc 2(&in, &out, cl) !- RPC SUCCESS) 

14 err quit("$s", clnt sperror(cl, argv[1])); 

15 printf("result: $1dWMn", out.res1); 

16 exit(0); 

17 } 


sunrpc/square3/client.c 











图 16-7 用 于 多 线程 化 服务 器 的 客户 程序 main 函 数 

声明 存放 结果 的 变量 

8 声明 一 个 square_out 类 型 的 变量 ， 而 不 是 指 回 该 类 型 的 一 个 指针 。 

过 程 调用 的 新 参数 

12~14 指 问 我们 的 out 变 量 的 指针 成 为 Squareproc_2 的 第 二 个 参数 ， 
客户 句柄 则 是 最 后 一 个 参数 。 该 函数 返回 的 不 再 是 指 癌 结果 的 指针 《如 
图 16-2 中 所 示 ) ， 而 是 返回 RPC_SUCCESS， 或 者 返回 表示 发 生 错 误 的 
有 某 个 其 他 值 。<rpc/clnt_stat.h> 头 文件 中 的 clnt_stat 枚 举 列 出 了 所 有 可 能 
的 出 错 返 回 值 Cenum) 。 

图 16-8 给 出 了 新 的 服务 器 过 程 。 与 图 16-6 一 样 ， 它 输出 自己 所 在 线 
程 的 线程 ID， 睡 眠 5 秒 钟 ， 输 出 另 一 个 消息 ， 然 后 返回 。 

















sunrpc/square3/server.c 


1 #include "unpipc.h" 
2 #include "square.h" 
3 bool t 


4 squareproc 2 svc(square in *inp, square out *outp, struct svc req *rqstp) 


6 printf ("thread %ld started, arg = %ld\n", 

7 pr thread id(NULL), inp->argl1) ; 

8 sleep(5); 

9 outp->resl = inp-»argl * inp-»argl; 

10 printf("thread $1d done\n", pr thread id(NULL)); 
a tak return (TRUE) ; 

12 } 

13 int 

14 square prog 2 freeresult (SVCXPRT *transp, xdrproc_t xdr result, 
T5 caddr t result) 
16 ( 

Ig xdr free(xdr result, result); 

18 return(1); 

19 } 


sunrpc/square3/server.c 





图 16-8 多 线程 化 的 服务 器 过 程 








新 的 参数 和 返回 值 

3 一 12 多 线程 化 所 需 的 变动 涉及 函数 参数 和 返回 值 。 我 们 不 再 返回 
一 个 指向 结果 结构 的 指针 (如 图 16-3 中 所 示 )〉 ， 指 向 该 结构 的 指针 现在 
成 了 本 函数 的 第 二 个 参数 。 指 向 svc_req 结 构 的 指针 现在 变 为 第 三 个 参 
数 。 本 函数 的 返回 值 在 成 功 时 为 TRUE， 在 发 生 错 误 时 为 FALSE。 

释放 XDR 内 存 空 间 的 新 函数 

13—19 ”我 们 必须 完成 的 男 一 个 源 代码 变动 是 提供 一 个 函数 来 释放 
自动 分 配 的 内 存 空间 。 该 函数 是 在 服务 器 过 程 返 回 并 且 其 结果 已 发 送 给 
客户 后 ， 从 服务 器 程序 存根 中 调用 的 。 在 图 16-8 中 ， 我 们 只 是 调用 普通 
的 xdr_free 函 数 。 “我 们 将 随 图 16-19 和 习题 16.10 详 细 讨 论 该 函数 。) 要 
是 我 们 的 服务 器 过 程 曾 经 分 配 了 任何 必要 的 内 存 空 间 以 容纳 结果 《〈 璧 如 
说 一 个 链表 ) ， 这 个 新 函数 就 可 以 释放 这 部 分 内 存 空间 。 

构造 出 新 的 客户 程序 和 服务 器 程序 后 ， 我 们 再 次 同时 运行 客户 程序 
的 三 个 副本 : 


solaris % client localhost 55 & client localhost 66 & \ 

















client localhost 77 & 


[3] 25427 
[4] 25428 
[5] 25429 


solaris % result: 4356 

result: 3025 

result: 5929 

这 一 次 我 们 能 够 辨别 出 那 三 个 结果 是 一 个 紧 接 一 个 地 输出 的 。 碍 看 
服务 右 的 输出 ， 我 们 看 到 服务 器 使 用 了 三 个 线程 ， 它 们 是 同时 运行 的 。 

solaris % server 

thread 1 started,arg = 55 

thread 4 started,arg = 77 

thread 6 started,arg = 66 

thread 6 done 

thread 1 done 

thread 4 done 

按照 多 线程 化 的 要 求 修 改 源 代 码 有 一 个 不 圣 的 副作用 ， 那 就 是 并 非 
所 有 系统 都 支持 这 个 特性 。 举 例 来 说 ，Digital Unix 4.0B 和 BSD/OS 3.1 提 
供 的 都 是 不 支持 多 线程 化 的 较 老 的 RPC 系 统 。 这 意味 着 如 果 我 们 想 在 这 
两 种 类 型 的 系统 上 编译 和 运行 一 个 程序 ， 那 么 在 其 客户 程序 和 服务 器 程 
序 中 必须 加 入 一 些 下 fdef 仿 指令 以 处 理 在 调用 序列 上 存在 的 差异 。 当 然 
举例 来 襄 ， BSD/OS 上 未 线程 化 的 一 个 客户 仍 能 调用 运行 在 Solaris 上 的 
一 个 多 线程 化 的 服务 嚣 过程， 但 是 如 果 我 们 有 一 个 希望 在 这 两 种 类 型 的 
系统 上 都 能 编译 的 RPC 客 户 程序 〈 或 服务 器 程序 ) ， 那 就 有 必要 修改 源 
代码 以 处 理 这 些 差异 。 


16.3 服务 器 捆绑 


在 描述 图 16-5 时 ， 我 们 掩饰 了 第 0 步 中 的 细节 : 服务 器 如 何 向 它 的 
本 地 端口 映射 器 (port mapper) 注册 自身 ， 客 户 如 何 发 现 服务 器 的 端口 
值 。 首 先 应 注意 的 是 ， 运 行 RPC 服 务 器 的 任何 主机 必须 在 运行 端口 映射 
器 。 赋 给 端口 映射 器 的 是 TCP 端 口 111 和 UDP 端口 111， 它 们 是 赋 给 Sun 
RPC 的 唯一 的 因特网 固定 端口 。RPC 服 务 器 总 是 先 捆绑 一 个 临时 端口 ， 
再 向 本 地 端口 映射 器 注册 自己 的 临时 端口 。 当 一 个 客户 启动 时 ， 它 必须 
首先 跟 服 务 器 主机 上 的 端口 映射 器 联系 ， 询 问 服务 器 的 临时 端口 号 ， 然 
后 跟 这 个 临时 端口 上 的 服务 器 联系 。 端 口 映 射 器 提供 了 一 个 范围 局 限于 
所 在 系统 的 名 字 服 务 。 

有 些 读 者 会 声称 NFS 也 有 一 个 固定 的 端口 号 2049。 尽 管 许多 实现 默 
认 使 用 这 个 端口 ， 而 且 某 些 较 早 的 实现 还 把 这 个 端口 号 硬 编码 到 客户 程 
序 和 服务 器 程序 中 ， 但 是 大 多 数 当 今 的 实现 允许 使 用 其 他 端口 号 。 大 多 
数 NFS 客 户 也 是 通过 与 服务 器 主机 上 的 端口 映射 器 联系 来 获取 NEFS 服 务 
器 的 端口 号 的 。 

BA Solaris 2.x 的 出 现 ，Sun 公 司 把 端口 映射 句 改 名 为 RPCBIND。 换 
名 的 原因 在 于 , “端口 ”一 词 隐 指 因特网 端口 ， 而 TI-RPC 软 件 包 能 够 工作 
在 任何 网 络 协议 上 ， 不 只 是 工作 在 TCP 和 UDP 协议 上 。 我 们 还 是 使 用 传 
统 的 名 字 : 端口 映射 器 。 另 外 在 下 面 的 讨论 中 ， 我 们 假设 服务 器 主机 只 
支持 TCP 和 UDP 协议 。 

服务 器 和 客户 是 按 如 下 的 步骤 执行 的 。 

(1) 当 系统 进入 多 用 户 模式 时 ， 端 口 映 射 器 启动 。 其 可 执行 文件 名 一 
为 portmap 或 rpcbind。 

(2) 当 我 们 的 服务 器 启动 时 ， 它 的 main 函 数 〈 该 函数 属于 由 rpcgen 产 
生 的 服务 喜 程 序 存根 的 一 部 分 ) 调用 库 函 数 svc_create。svc_create 确 定 
本 主机 所 支持 的 网 络 协议 ， 并 为 每 个 协议 创建 一 个 传输 端点 (例如 套 接 
字 ) ， 给 TCP 和 UDP 端点 各 捆绑 一 个 临时 端口 。 该 函数 然后 与 本 地 的 端 
口 映 射 器 联系 ， 向 它 注册 (CTCP 和 UDP) 这 两 个 临时 端口 号 以 及 调用 程 























序 的 RPC 程 序号 和 版 本 号 。 
端口 映射 器 本 号 是 一 个 RPC 程 序 ， 服 务 咯 束 是 使 用 RPC 调 用 回 端 口 
映射 句 注 册 目 身 的 《不 过 所 用 端口 为 已 知 的 111) o RFC 
1833 [Srinivasan 1995c] 中 有 端口 映射 器 所 文 持 过 程 的 相关 说 明 。 这 个 
RPC 程 序 存在 三 个 版 本 : 版 本 2 是 历史 久远 的 端口 映射 器 ， 只 处 理 TCP 
和 UDP 席 口 ， 版 本 3 和 版 本 4 则 采用 较 新 的 RPCBIND 协 议 。 
通过 执行 rpcinfo 程 序 ， 我 们 可 以 看 到 已 向 端口 映射 器 注册 了 的 所 有 
RPC 程 序 。 我 们 可 执行 该 程序 来 验证 端口 映射 器 本 身 使 用 端口 号 111。 
solaris % rpcinfo -p 
program vers proto port service 
100000 4 tcp 111 rpcbind 
100000 3 tcp 111 rpcbind 
100000 2 tcp 111 rpcbind 
100000 4  udp 111 rpcbind 
100000 3 udp 111 rpcbind 
100000 2 udp 111 rpcbind 
《我 们 已 省 略 掉 了 输出 中 的 许多 额外 的 行 。) 我 们 看 到 Solaris 2.6 
文 持 所 有 三 个 版 本 的 协议 ， 全 部 在 端口 111 上 ， 并 且 或 者 使 用 TCP， 或 
者 使 用 UDP。 从 RPC 程 序号 到 服务 号 的 映射 关系 通 常 存放 在 文件 /etc/rpc 
中 。 在 BSD/OS ”3.1 下 执行 同样 的 命令 ， 结 果 表 明 它 只 支持 版 本 2 的 端口 
映射 器 RPC 程 序 。 
bsdi % rpcinfo -p 
program vers proto port 
100000 2 tcp 111 portmapper 
100000 2 udp 111 portmapper 
Digital Unix 4.0B 也 只 支持 版 本 2: 
alpha % rpcinfo -p 


program vers proto port 
100000 2 tcp 111 portmapper 
100000 2 udp 111 portmapper 

然后 我 们 的 服务 器 程序 进入 睡眠 ， 等 待 客户 请 求 的 到 达 。 这 种 请 求 
可 以 是 在 其 TCP 病 口上 的 一 个 新 连接 ， 也 可 以 是 在 其 UDP 病 口上 的 一 个 
UDP 数 据 报 的 到 达 。 启 动 图 16-3 给 出 的 服务 器 后 执行 pcinfo， 我们 看 
到 : 

solaris % rpcinfo -p 

program vers proto port service 

824377344 1 udp 47972 

824377344 1 tcp 40849 

其 中 824377344 等 于 0x31230000， 它 是 我 们 在 图 16-1 所 赋 的 程序 
号 。 我 们 还 在 该 图 中 赋 了 一 个 值 为 1 的 版 本 号 。 注 意 ， 服 务 器 准备 好 或 
者 使 用 TCP 或 者 使 用 UDP 接受 客户 请 求 ， 客 户 则 在 创建 客户 句柄 时 选择 
使 用 其 中 哪个 协议 (图 16-2 中 dnt_cre_ate 的 最 后 一 个 参数 ) 。 

(3) 客 户 启 动 并 调用 clnt_create。 该 函数 的 参数 (图 16-2) 包括 : Hk 
务 占 主机 的 主机 名 或 I1P 地 址 、 程 序号 、 版 本 写 及 指定 所 用 协议 的 字符 
串 。 客 户 向 服务 器 主机 的 端口 映射 器 发 送 一 个 RPC 请 求 〈 这 个 RPC 消 息 
通常 使 用 UDP 作为 所 用 协议 ) ， 询 问 关 于 所 指定 的 程序 、 版 本 和 协议 的 
童 轧 。 假 设 成 功 的 话 ， 作 为 答复 的 服务 器 端口 号 融 保 存 到 客户 句柄 中 ， 
供 将 来 使 用 该 句柄 的 所 有 RPC 调 用 参考 。 

在 图 16-1 中 ， 我 们 给 例子 程序 使 用 了 值 为 0x31230000 的 程序 号 。 这 
个 32 位 的 程序 号 是 划分 成 组 的 ， 如 图 16-9 所 示 。 











0x00000000-0x1fffffff 由 Sun 定 义 


0x20000000-0x3fffffff 由 用 户 定 义 
0x40000000-0x5fffffff 临时 《〈 供 客户 编写 的 应 用 程序 用 ) 
0x60000000-0xffffffff 保留 








图 16-9 Sun RPC 的 程序 号 范围 

rpcinfo 程 序 显示 本 系统 上 当前 已 注册 的 程序 。 一 个 给 定 系统 上 所 文 
持 RPC 程 序 的 相关 信息 的 男 一 个 来 源 是 目录 /usr/inelude/rpcsvc 中 的 .x 文 
f. 

inetd 和 RPC 服 务 器 

默认 情况 下 ， 由 rpcgen 创 建 的 服务 器 可 由 inetd 超 级 服务 器 激活 。 

CUNPv1 的 12.5 节 [6] 详细 讨论 了 inetd。) 查看 由 rpcgen 产 生 的 服务 器 程 
序 存根 ， 可 看 到 服务 器 程序 main 函 数 启 动 时 ， 会 检查 标准 输入 是 不 是 一 
个 XTI 端 点 ， 硅 是 则 假定 自 映 是 由 inetd 局 动 的 。 

为 了 文 持 这 一 特性 ， 在 创建 了 一 个 将 由 inetd 激 活 的 一 个 RPC 服 务 器 
之 后 ， 必 须 以 该 服务 器 的 信息 更 新 /etc/inetd.conf 配 置 文件 ， 这 些 信息 包 
括 : RPC 程 序 名 、 所 文 持 的 程序 号 、 所 文 持 的 协议 、 服 务 器 程序 可 执行 
文件 的 路 径 名 。 作 为 一 个 例子 ， 下 面 是 出 自 Solaris 配 置 文件 中 的 一 行 : 

rstatd/2-4 tli rpc/datagram_v wait root 

/usr/lib/netsvc/rstat/rpc.rstatd rpc.rstatd 

其 中 第 一 栏 是 程序 名 《 它 将 被 映射 成 相应 的 程序 号 ， 这 种 映射 关系 
存放 在 /etc/rpc 文 件 中 ) ， 所 文 持 的 版 本 为 2>、3 和 4。 下 一 栏 指定 一 个 XTI 
端点 《与 套 接 字 端 点 相对 立 ) ， 第 三 栏 指定 所 有 可 见 的 数据 报 协议 都 受 
支持 。 查 看 文件 /etc/neteonfig， 看 到 这 样 的 协议 有 两 个 : UDP 
和 /dev/clts。 〈UNPv1 第 29 章 讲述 该 文件 和 XTI 地 址 。) 第 四 栏 wait 告 诉 
inetd 在 监 昕 发 往 相 应 XTI 端 点 的 下 一 个 客户 请 求 前 ， 先 等 竺 本 服务 器 当 


前 这 次 激活 终止 。/etc/inetd.conf 中 的 所 有 RPC 服 务 器 都 指定 wait 属 性 。 

再 下 一 栏 root 指 定 本 程序 将 在 这 个 用 户 ID 下 运行 ， 最 后 两 栏 是 本 程 
序 可 执行 文件 的 路 径 名 以 及 程序 名 ， 外 带 传 递 给 该 程序 的 任何 命令 行 参 
数 《〈 本 程序 没有 命令 行 参数 ) 。 

inetd 将 给 所 指定 的 程序 及 版 本 创建 XTI 端 点 ， 并 同 端 口 映 射 器 登记 
这 些 端点 。 我 们 可 使 用 mpcinfo 程 序 验 证 这 一 点 : 


solaris % rpcinfo | grep statd 





100001 2 udp 0.0.0.0.128.11 rstatd 
superuser 

100001 3 udp 0.0.0.0.128.11 rstatd 
superuser 

100001 4 udp 0.0.0.0.128.11 rstatd 
superuser 

100001 2 ticlts \000\000\020, rstatd 
superuser 

100001 3 ticlts \000\000\020, rstatd 
superuser 

100001 4 ticlts \000\000\020, rstatd 
superuser 


He AEX TTAB AY A NR CE REET THN ， 
128x256+11=32779 是 分 配给 该 XTI 端 点 的 UDP 临 时 端口 号 。 

当 一 个 UDP 数据 报到 达 端 口 32779 时 ，inetd 将 检测 到 有 一 个 数据 报 
已 准备 好 被 读 入 ， 于 是 它 fork 并 exec 程 序 /usvlib/netsvc/rstat/rpc.rstatd。 在 
fork 和 exec 之 间 ， 该 服务 器 的 XTI 跨 点 被 复制 到 摘 述 符 0、1 和 2 上 ，inetd 
的 所 有 其 他 描述 符 则 都 被 关闭 (UNPv1 的 图 12-7 [7] ) 。inetd 还 将 停止 
监听 发 往 该 XTI 端 点 的 新 的 客户 请 求 ， 直 到 当前 这 次 服务 器 激活 ( 它 是 
inetd 的 一 个 子 进程 ) 终止 为 止 ， 这 是 因为 该 服务 器 在 配置 文件 中 指定 了 


wait 属 性 的 缘故 。 

假设 该 程序 是 由 rpcgen 产 生 的 ， 它 将 检测 到 标准 输入 是 一 个 XTI 端 
点 ， 于 是 相应 地 把 该 端点 初始 化 为 一 个 RPC 服 务 器 端点 。 这 是 通过 调用 
RPC 函 数 svc_tli_create 和 svc_reg 完 成 的 ， 我 们 不 再 讨论 它们 。 第 二 个 函 
数 并 不 同 端口 映射 器 登记 本 服务 器 ， 这 步 工 作 只 由 inetd 在 启动 时 做 一 
次 。 该 RPC 服 务 器 接着 进入 循环 ， 由 名 为 svc_run 的 函数 读 入 待 处 理 的 数 
据 报 ， 并 调用 相应 的 服务 器 过 程 来 处 理 这 个 客户 请 求 。 

通常 情况 下 ， 由 inetd 激 活 的 服务 器 处 理 完 一 个 客户 请 求 后 就 终止 ， 
以 此 允许 inetd 等 待 下 一 个 客户 请 求 。 作 为 一 种 优化 手段 ， 由 rpcgen 产 生 
的 RPC 服 务 器 会 等 待 一 小 段 时 间 (默认 值 为 2 分 钟 )， 以 防 男 一 个 客户 
请 求 在 这 段 时 间 内 到 达 。 如 果真 是 这 样 ， 这 个 已 经 在 运行 的 现 有 服务 器 
将 读 入 新 的 数据 报 并 处 理 其 请 求 。 这 就 避免 了 给 短 时 间 内 相继 到 达 的 多 
个 客户 请 求 分 别 执行 一 次 fork 和 一 次 exec 的 开销 。 过 了 这 上 段 小 的 等 待 期 
后 ， 服 务 器 将 终止 。 这 将 给 inetd 产 生 一 个 SIGCHLD 信 和 号， 从 而 导致 它 
再 次 开始 查看 该 XITI 端 点 上 有 无 数据 报到 达 。 











16.4 认证 





默认 情况 下 ，RPC 请 求 中 没有 标识 客户 的 信息 。 服 务 占 回答 客户 的 
请 求 时 并 不 关心 客户 是 谁 。 这 称 为 空 认证 (null authentication ) 或 
AUTH_NONE. 

下 一 个 认证 级 别称 为 Unix 认 证 (Unix authentication) 或 
AUTH SYS。 客户 必须 告诉 RPC 运 行 时 系统 随 每 个 请 求 携 带 其 身份 信息 
(主机 名 、 有 效用 户 ID、 有 效 组 ID 和 可 能 多 个 辅助 组 ID) 。 我 们 把 16.2 
节 中 的 客户 -服务 器 程序 修改 成 包括 Unix 认 证 。 图 16-10 给 出 了 其 中 的 客 
户 程序 。12 一 13 ”这 两 行 是 新 的 。 我 们 首先 调用 auth_destroy 销 毁 与 本 客 
户 句柄 关联 的 先前 的 认证 ， 也 就 是 默认 创建 的 空 认证 。 然 后 调用 函数 





authsys_create_default 创 建 相应 的 Unix 认 证 结构 ， 并 把 该 结构 存 入 客户 名 
柄 CLIENT 结构 的 clL_auth 成 员 中 。 客 户 程 序 的 其 余部 分 与 图 16-7 的 一 


FE. 


sunrpc/square4/client.c 





1 #include "unpipc.h" 
2 #include "square.h" 
3 int 


4 main(int argc, char **argv) 


CLIENT *cl; 
square_in in; 
Square out out; 


if (argc != 3) 
err quit("usage: client «hostname» <integer-value>") ; 


cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 


auth destroy(cl-»cl auth); 
Cl-»cl auth = authsys create default (); 


in.argl = atol(argv[21]); 
if (squareproc 2(&in, &out, cl) !- RPC SUCCESS) 
err quit("$s", clnt sperror(cl, argv[11)); 


printf("result: %ld\n", out.res1); 
exit(0); 





sunrpc/square4/client.c 


图 16-10 提供 Unix 认 证 的 客户 程序 


图 16-11 给 出 了 新 的 服务 器 过 程 ， 它 从 图 16-8 修 改 而 来 。 我 们 没有 给 
出 square_prog_2_freeresult 函 数 ， 它 没有 变动 。 


sunrpc/square4/server.c 





1 #include "unpipc.h" 
2 #include "square.h" 
3 bool t 


4 squareproc 2 svc(square in *inp, square out *outp, struct svc req *rqstp) 


6 printf ("thread $1d started, arg = $1d, auth = %d\n", 

y pr thread id(NULL), inp->argl, rqstp-»rq cred.oa flavor); 
8 if (rqstp-»rq cred.oa flavor -- AUTH SYS) ( 

9 struct authsys parms *au; 

10 au = (struct authsys parms *)rqgstp-»rq clntcred; 

11 printf("AUTH SYS: host %s, uid %ld, gid %ld\n", 

12 au-»aup machname, (long) au-»aup uid, (long) au-»aup gid); 
13 } 

14 sleep (5) ; 

15 outp-»resl = inp->argl * inp-»argl; 

16 printf ("thread $1d done\n", pr_thread_id(NULL) ) ; 

17 return (TRUE); 

18 } 


sunrpc/square4/server.c 





图 16-11 





寻找 Unix 认 证 的 服务 器 过 程 











6 一 8 ”现在 使 用 一 个 指向 svc_req 结 构 的 指针 ， 它 总 是 作为 一 个 参数 


传递 给 服务 右 过 程 。 
struct svc_req { 
u_long 
u_long 
u_long 
struct opaque_auth 
caddr_t 
(read-only)*/ 
SVCXPRT 
io 
struct opaque auth { 
enum t oa flavor; 
caddr t oa base; 


u int oa length; 


rq prog; /* program number */ 

rq vers; /* version number */ 

rq proc; /* procedure number */ 
rq cred; /* raw credentials */ 


rq cintcred; /* cooked credentials 


*rq_xprt; /* transport handle */ 


/* flavor: AUTH_xxx constant */ 


/* address of more auth stuff */ 
/* not to exceed MAX AUTH BYTES 


*/ 

js 

其 中 rq_cred 成 员 含 有 原始 认证 信息 ， 它 的 oa_flavor 成 员 是 一 个 标识 
认证 类 型 的 整数 。 “原始 Craw) ”一 词 意味 着 RPC 运 行 时 系统 没有 处 理 
由 oa_base 指 向 的 信息 。 然 而 ， 如 果 是 运行 时 系统 文 持 的 认证 类 型 的 
话 ， 那 么 由 rq_clntcred 指 疝 的 成 熟 (cooked) 凭证 已 被 运行 时 系统 处 理 
成 某 个 适合 那 种 认证 类 型 的 结构 。 我 们 输出 认证 类 型 ， 并 检查 它 是 否 等 
于 AUTH_SYS。 

9—12 ”对 于 Unix 认 证 ， 指 加 成 熟 凭 证 的 指针 Crq_clntcred) 所 指 的 
是 含有 客户 身份 的 一 个 authsys_parma 结 构 : 


struct authsys_parms { 








u long aup time; /* credentials creation time */ 

char *aup machname;/* hostname where client is located */ 
uid t aup uid; /* effective user ID */ 

gid t aup gid; /* effective group ID */ 

u int aup len; /* #elements in aup. gids[] */ 


gid t *aup_gids; /* supplementary group IDs */ 








hi 

我 们 取得 指向 这 个 结构 的 指针 后 ， 输 出 客户 的 主机 名 、 有 效用 户 ID 
和 有 效 组 ID。 

启动 我 们 的 服务 器 ， 然 后 运行 客户 程序 一 次 ， 我 们 从 服务 器 得 到 如 
下 的 输出 : 


solaris % server 

thread 1 started,arg = 44,auth = 1 

AUTH_SYS: host solaris.kohala.com,uid 765,gid 870 

thread 1 done 

Unix 认 证 很 少 使 用 ， 因 为 它 极 易 被 攻破 。 我 们 可 以 很 容易 地 自行 构 


造 含 有 Unix 认 证 信息 的 RPC 分 组 ， 把 其 中 的 用 户 ID 和 组 ID 设置 成 我 们 想 
要 的 任何 值 ， 然 后 发 送 给 服务 器 。 服 务 器 没有 办 法 验证 我 们 就 是 所 声称 
的 客户 。 

实际 上 NFS 默 认 使 用 Unix 认 证 ， 然 而 NFS 请 求 通常 是 由 NFS 客 户主 
机 的 内 核发 出 的 ， 而 且 通 常 使 用 一 个 保留 端口 CUNPv1 的 2.7 节 ) 。 有 
些 NFS 服 务 器 配置 成 只 响应 从 一 个 保留 端口 到 达 的 客户 请 求 。 如 有 果 你 信 
任 想 要 往 其 上 安装 你 的 文件 系统 的 客户 主机 ， 那 么 你 也 在 信任 该 客户 主 
机 的 内 核能 正确 地 标识 自己 的 用 户 。 要 是 服务 器 不 要 求 客户 使 用 一 个 保 
留 端 口 ， 黑 客 们 就 能 够 自行 编写 出 向 NFS 服 务 器 发 送 NFS 请 求 的 程序 ， 
其 中 的 Unix 认 证 ID 可 设置 成 任意 想 要 的 值 。 即 使 服务 器 要 求 客户 使 用 一 
个 保留 端口 ， 如 果 你 拥有 一 个 自己 具有 超级 用 户 特 权 的 系统 ， 而 且 你 能 
够 把 自己 的 系统 接 入 网 络 中 ， 那 么 你 仍 可 以 向 服务 器 发 送 自己 的 NFS 请 
se 

不 论 是 请 求 还 是 应 答 ， 一 个 RPC 分 组 中 实际 都 含有 两 个 与 认证 相关 
的 字段 : 凭证 《credential) 和 验证 器 (verifier) 〈 图 16-30 和 图 16- 
32) 。 一 个 各 用 的 类 比 是 带 相片 的 身份 证 件 〈 护 照 、 轰 驶 执照 等 ) 。 竺 
证 是 印 制 的 信息 〈 姓 名 、 住 址 、 出 生日 期 等 ) ， 验 证 器 则 是 相片 。 验 证 
器 还 有 其 他 的 形式 ， 不 过 相片 的 效果 要 比 列 出 身高 、 体 重 、 性 别 等 更 
好 。 如 果 我 们 有 一 个 没有 任何 形式 的 识别 信息 的 身份 证 件 〈 图 书馆 借 书 
卡 往往 是 这 样 的 例子 ) ， 那 么 我 们 是 光 有 凭证 而 没有 验证 器 ， 因 而 任何 
人 都 可 以 使 用 它 并 声称 是 它 的 主人 。 

在 空 认 证 的 情况 下 ， 和 凭证 和 验证 器 都 是 空 的 。 使 用 Unix 认 证 时 ， 和 赁 
证 中 含有 主机 名 、 用 户 人 D 和 组 ID， 但 是 验证 器 是 空 的 。RPC 还 文 持 其 他 
形式 的 认证 ， 它 们 的 凭证 和 验证 器 含有 的 信息 也 不 一 样 。 

AUTH SHORT ” 男 一 种 形式 的 Unix 认 证 ， 在 从 服务 器 返回 客户 的 
RPC 应 答 的 验证 器 字段 中 发 送 。 它 的 信息 量 比 完整 的 Unix 认 证 少 ， 而 且 
客户 可 以 在 后 续 的 请 求 中 把 它 作 为 凭证 发 送 回 服 务 器 。 这 种 认证 类 型 的 














意图 在 于 节省 网 络 带 宽 和 服务 器 主机 的 CPU 时 间 。 

AUTH DES DES 是 数据 加 密 标 准 (Data Encryption Standard) 的 首 
字母 缩写 ， 这 种 认证 形式 基于 私 钥 和 公 钥 加 密 机 制 。 这 种 方案 也 称 为 安 
全 的 RPC (secure RPC) ， 当 用 作 NFS 的 基础 时 ， 这 样 的 NFS 称 为 安全 
的 NFS (secure NFS) 。 

AUTH KERB 这 种 方案 基于 MIT 的 Kerberos 认 证 系统 。 

[Garfinkel and Spafford 1996] 第 19 章 详细 讨论 了 后 两 种 形式 的 认 
证 ， 包 括 它 们 的 设置 和 使 用 。 


16.5 趣 时 和 


现在 查看 Sun RPC 使 用 的 超时 和 重 传 策略 。Sun RPC 使 用 了 两 个 超 
时 值 。 

(1) 总 超时 (total timeout) : 一 个 客户 等 符 其 服务 器 的 应 答 的 总 时 
间 量 。TCP 和 UDP 都 使 用 该 值 。 


服务 器 的 应 答 期 间 每 次 重 传 请 求 的 间隔 时 间 。 
首先 应 注意 使 用 TCP 不 需要 重 试 超时 ， 因 为 TCP 是 一 个 可 靠 的 协 

议 。 如 果 服 务 器 主机 没有 接收 到 客户 的 请 求 ， 客 户主 机 的 TCP 就 会 超时 
并 重 传 该 请 求 。 当 服务 器 主机 接收 到 客户 的 请 求 时 ， 服 务 器 主机 的 TCP 
会 向 客户 主机 的 TCP 确 认 这 次 收 到 。 如 果 服 务 器 的 确认 是 数据 丢失 ， 导 
致 客户 主机 的 TCP 重 传 该 请 求 ， 那 么 当 服 务 器 主机 的 TCP 接 收 到 这 个 重 
复 的 数据 时 ， 它 将 丢弃 该 数据 ， 并 再 次 发 出 一 个 确认 。 有 了 可 靠 的 协议 
后 ， 可 靠 性 (超时 、 重 传 、 对 重复 数据 或 重复 确认 的 处 理 ) 就 由 传输 层 
提供 ，RPC 运 行 时 系统 不 再 关心 它 。 由 客户 主机 RPC 层 发 出 的 一 个 请 求 
将 由 服务 器 主机 RPC 层 作为 一 个 请 求 接 收 ( 如 果 这 个 请 求 从 未 得 到 过 确 
认 ， 那 么 客户 主机 RPC 层 将 得 到 一 个 出 错 指示 ) ， 而 不 管 在 网 络 层 和 传 

















输 层 上 发 生 什么 。 

创建 一 个 客户 句柄 后 ， 我 们 可 以 调用 clnt_control] 得 询 或 设置 影响 该 
句柄 的 选项 。 这 类 似 于 给 一 个 描述 符 调 用 fcntl， 或 者 给 一 个 套 接 字 调 用 
getsockopt 和 setsockopt。 

#include <rpc/rpc.h> 

bool_t clnt_control(CLIENT *cl,unsigned int request,char *ptr); 

返回 : 若 成 功 则 为 TRUE， 若 出 错 则 为 FALSE 

其 中 dl 是 客户 句 顶 ， 由 ptr 指 疝 的 内 容 则 取决 于 request。 

我 们 把 图 16-2 给 出 的 客户 程序 修改 为 调用 该 函数 并 输出 RPC 的 两 个 
超时 值 。 图 16-12 给 出 了 这 个 新 的 客户 程序 。 











sunrpc/square5/client.c 


1 #include "unpipc.h" 

2 #include "Square.h" 

3 int 

4 main(int argc, char **argv) 

5 

6 CLIENT *cl; 

7 square in in; 

8 Square out *outp; 

9 struct timeval tv; 

10 if (argc !- 4) 

11 err quit("usage: client «hostname» «integer-value» <protocol>") ; 
12 cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, argv[3]); 

13 Clnt_control (cl, CLGET_TIMEOUT, (char *) &tv); 

14 printf ("timeout = $1d sec, $1d usec\n", tv.tv_sec, tv.tv_usec) ; 
15 if (clnt_control(cl, CLGET_RETRY_TIMEOUT, (char *) &tv) == TRUE) 
16 printf ("retry timeout = %ld sec, $1d usec\n", tv.tv sec, tv.tv_usec); 
17 in.argl = atol(argv[2]) ; 

18 if ( (outp = squareproc_1(&in, cl)) == NULL) 
19 err quit("$s", clnt sperror(cl, argv[11)); 
20 printf("result: %ld\n", outp-»res1); 
21 exit (0); 
22 ) 


sunrpc/square5/client.c 








图 16-12 查询 并 输出 两 个 RPC 超 时 值 的 客户 程序 
协议 是 一 个 命令 行 选项 
10~12 现在 作为 另 一 个 命令 行 选项 来 指定 协议 ， 并 把 它 用 作 





clnt_create 的 最 后 一 个 参数 。 

取得 总 超时 

13~14 clnt_control 的 第 一 个 参数 是 客户 句柄 ， 第 二 个 参数 是 请 求 ， 
第 三 个 参数 则 通常 是 指向 一 个 缓冲 区 的 指针 。 我 们 的 第 一 个 请 求 是 
CLGET_TIMEOUT， 它 在 其 地 址 为 第 三 个 参数 的 timeval 结 构 中 返回 总 
超时 值 。 该 请 求 对 所 有 协议 都 有 效 。 

尝试 取得 重 试 超时 

15~16 我 们 的 下 一 个 请 求 是 获取 重 试 超 时 的 
CLGET_RETRY_TIMEOUT， 不 过 这 个 超时 只 对 UDP 有 效 。 因 此 ， 如 果 
返回 值 为 FALSE， 我 们 就 什么 都 不 输出 。 

我 们 还 把 图 16-6 给 出 的 服务 器 程序 修改 为 睡眠 1000 秒 而 不 是 5 秒 ， 
以 保证 客户 的 请 求 超时 。 在 主机 bsdi 上 启动 服务 器 后 运行 客户 程序 两 
次 ， 一 次 指定 TCP 协 议 ， 一 次 指定 UDP 协议 ， 然 而 结果 并 不 是 我 们 所 预 
期 的 : 

solaris % date ; client bsdi 44 tcp ; date 

Web Apr 22 14:46:57 MST 1998 

















timeout = 30 sec,0 usec 超时 值 说 是 30 秒 

bsdi: RPC: Timed out 

Web Apr 22 14:47:22 MST 1998 但 这 是 在 25 秒 后 
输出 的 


solaris % date ; client bsdi 55 udp ; date 
Web Apr 22 14:48:05 MST 1998 


timeout = -1 sec,-1 usec 奇怪 

retry timeout = 15 sec,0 usec 这 倒是 正确 的 

bsdi: RPC: Timed out 

Web Apr 22 14:48:31 MST 1998 大 约 25 秒 之 后 


在 使 用 TCP 的 情况 下 ， 由 cntl_control 返 回 的 总 超时 值 为 30 秒 ， 但 是 


我 们 的 测量 给 出 一 个 25 秒 的 超时 值 。 至 于 使 用 UDP 的 情况 ， 所 返回 的 总 
超时 值 为 -1。 

为 查看 究竟 发 生 了 什么 ， 我 们 分 析 由 rpcgen 产 生 的 客户 程序 存根 文 
件 square_clnt.c 中 的 squareproc_1 函 数 。 该 函数 调用 clnt_call， 传 递 给 它 的 
最 后 一 个 参数 是 名 为 TIMEOUT 的 一 个 timeval 结 构 ， 这 个 变量 在 该 文件 
中 声明 ， 它 的 初始 值 为 25 秒 。 传 递 给 clnt_call 的 这 个 参数 敢 盖 了 用 于 
TCP 的 30 秒 默认 超时 值 和 用 于 UDP 的 默认 值 -1。 这 个 参数 一 直 沿 用 a 到 客 
户 以 一 个 CLSET_TIMEOUT 请 求 调用 clnt_control 显 式 地 设置 总 超时 值 为 
止 。 如 果 我 们 想 改 变 总 超时 值 ， 那 就 应 该 调用 clnt_control， 而 不 应 该 修 
改 客户 程序 存根 中 的 timeval 结 构 变 量 TIMEOUT。 

验证 UDP 重 试 超 时 的 唯一 办 法 是 使 用 tcpdump 观 察 分 组 。 这 种 观察 
表明 ， 第 一 个 数据 报 是 在 客户 一 局 动 后 就 发送 的 ， 下 一 个 数据 报 的 发 送 
则 在 约 15 秒 之 后 。 

16.5.1 TCP 连 接管 理 

使 用 tcpdump 观 罕 刚 才 描 述 的 客户 -服务 器 程序 的 运行 情况 ， 我 们 首 
先 看 到 TCP 的 三 路 握手 ， 然 后 是 客户 发 送 其 请 求 ， 服 务 器 确认 这 个 请 
求 。 大 约 25 秒 后 ， 客 户 发 送 一 个 FIN 分 节 ， 它 是 由 客户 进程 即将 终止 引 
起 的 ， 接 着 是 TCP 连 接 终 止 序列 的 其 余 三 个 分 季 。UNPvV1 的 2.5 市 详细 讲 
述 了 这 些 分 节 。 

我 们 想 要 展示 Sun ”RPC 在 使 用 TCP 连 接 上 的 以 下 特征 :客户 通过 调 
用 clnt_create 建 立 一 个 新 的 TCP 连 接 ， 这 个 连接 由 与 所 指定 的 程序 和 版 
本 相关 联 的 所 有 过 程 调 用 来 使 用 。 一 个 客户 的 TCP 连 接 或 者 通过 调用 
clnt_destroy 显 式 地 终止 ， 或 者 由 客户 进程 的 终止 隐 式 地 终止 。 

#include <rpc/rpc.h> 

void clnt_destroy(CLIENT *cl); 

我 们 从 图 16-2 的 客户 程序 着 手 ， 把 它 修 改 成 调用 服务 器 过 程 两 次 ， 
然后 调用 clnt_destroy， 接 着 pause。 图 16-13 给 出 了 这 个 新 的 客户 程序 。 





























sunrpc/square9/client.c 





1 #include "unpipc.h" /* our header */ 
2 #include "Square.h" /* generated by rpcgen */ 
3 int 


4 main(int argc, char **argv) 


5 { 


6 CLIENT *cl; 
" Square in in; 
8 Square out *outp; 
9 if (argc != 3) 
10 err quit("usage: client «hostname» <integer-value>") ; 
11 cl - Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 in.argl = atol(argv[21); 
13 if ( (outp = squareproc_1(&in, cl)) == NULL) 
14 err quit("$s", clnt sperror(cl, argv[11)); 
15 printf ("result: %ld\n", outp->res1) ; 
16 in.argl *= 2; 
17 if ( (outp = squareproc_1(&in, cl)) == NULL) 
18 err quit("$s", clnt sperror(cl, argv[1])); 
19 printf("result: $1dWMn", outp->res1) ; 
20 clnt destroy (cl); 
21 pause(); 
22 exit (0); 
23 } 


sunrpc/square9/client.c 








图 16-13 检查 TCP 连 接 使 用 情况 的 客户 程序 
运行 这 个 程序 得 到 了 预期 的 输出 : 
solaris % client kalae 5 
result: 25 
result: 100 
程序 只 是 等 待 ， 直 到 我 们 杀 和 死 它 为 止 
不 过 验证 我 们 早先 给 出 的 声明 只 能 通过 观察 tcpdump 的 输出 。 这 个 
输出 表明 ， 有 一 个 TCP 连 接 被 创建 了 《〈 通 过 调用 clnt_create) ， 而 且 两 
个 客户 请 求 都 使 用 这 个 连接 。 访 连接 然后 由 clnt_destroy 调 用 终止 ， 尽 管 
当时 客户 进程 还 没有 终止 。 
16.5.2 事务 ID 
超时 和 重 传 策略 的 男 一 部 分 是 使 用 事务 ID (transaction ID) 即 XID 














来 标识 客户 请 求 和 服务 器 应 答 的 。 当 一 个 客户 发 出 一 个 RPC 调 用 时 ， 
RPC 运 行 时 系统 给 这 个 调用 赋 一 个 32 位 整数 XID， 该 值 伴随 RPC 消 息 发 
送 。 服 务 器 必须 伴随 其 应 答 返 回 这 个 XID。RPC 运 行 时 系统 重 传 一 个 请 
求 时 ， XID 并 不 改变 。 使 用 XID 的 目的 有 两 个 。 

(1) 客 户 验证 应 管 的 XID 等 于 早先 随 请 求 发 送 的 XID， 盏 则 的 话 客户 
忽略 这 个 应 答 。 如 果 使 用 的 是 TCP 协 议 ， 那 么 客户 收 到 XID 不 正确 的 应 
答 的 机 会 非常 罕见 ， 然 而 如 果 使 用 的 是 UDP 协议 ， 而 且 存 在 重 传 请 求 的 
可 能 ， 网 络 也 易于 丢失 分 组 ， 那 么 接收 到 XID 不 正确 的 应 答 是 绝对 可 能 
的 。 

(2) 服 务 器 允许 维护 一 个 存放 已 发 送 应 答 的 高 速 缓存 〈cache) Tf] 
用 于 确定 一 个 请 求 是 否 为 一 个 重复 请 求 的 条 目 之 一 是 XID。 我 们 稍 后 讨 
论 这 个 高 速 缓存 。 

TIL_RPC 软 件 包 使 用 以 下 算法 来 给 一 个 新 请 求 选 择 一 个 XID， 其 中 ^ 
运算 符 是 C 的 按 位 异 或 : 

struct timeval now; 

gettimeofday(&now,NULL); 

xid = getpid()^ now.tv_sec ^ now.tv_usec; 

16.5.3 服务 器 重复 请 求 高 速 缓存 

为 使 能 RPC 运 行 时 系统 维护 一 个 重复 请 求 高 速 缓存 ， 服 务 器 必须 调 
用 svc_dg_enablecache。 一 旦 局 用 了 这 个 高 速 缓存 ， 就 没有 办 法 关 掉 它 

《除非 服务 器 进程 终止 ) 。 


#include <rpc/rpc.h> 




















int svc_dg_enablecache(SVCXPRT *xprt,unsigned long size); 
返回 : ARIO, AREA- 
其 中 xprt 是 一 个 传输 句柄 ， 该 指针 是 svc_req 结 构 的 一 个 成 员 (16.4 
TO 。 而 该 结构 的 地 址 是 作为 一 个 参数 传递 给 服务 器 过 程 的 。size 是 需 
为 之 分 配 内 存 空间 的 高 速 缓存 项 数 。 











局 用 该 高 速 缓存 后 ， 服 务 器 便 为 它 所 发 送 的 全 部 应 答 维护 一 个 
FIFO《〈 先 进 先 出 ) 高 速 缓存 。 每 个 应 答 是 由 如 下 信息 唯一 标识 的 : 

程序 号 ; 

版 本 号 ; 

过 程 号 ; 

XID; 

客户 地 址 (CIP 地 址 和 UDP 端口 号 ) 。 

每 当 服 务 器 中 的 RPC 运 行 时 系统 接收 到 一 个 客户 请 求 时 ， 首 先 会 搜 
索 重 复 请 求 高 速 绥 存 ， 看 其 中 是 否 已 有 该 请 求 的 一 个 应 答 。 如 果 有 的 
话 ， 这 个 高 速 绥 存 的 应 答 就 返回 给 客户 ， 而 不 再 调用 相应 的 服务 器 过 
程 。 

重复 请 求 高 速 缓存 的 目的 是 : 当 接 收 到 对 某 个 服务 器 过 程 的 多 个 重 
复 请 求 时 ， 避 免 多 次 调用 该 服务 器 过 程 ， 因 为 该 过 程 也 许 不 是 等 势 的 。 
在 网 络 中 接收 到 重复 请 求 的 可 能 原因 是 应 答 丢 失 或 者 客户 重 传 请 求 超前 
于 应 答 的 接收 。 注 意 ， 这 种 重复 请 求 高 速 绥 存 只 适用 于 像 UDP 这 样 的 数 
据 报 协议 ， 因 为 使 用 TCP 协 议 时 应 用 绝对 看 不 到 重复 的 请 求 ， 请 求 的 重 
复 问题 是 由 TCP 处 理 的 (见习 题 16.6) . 
































在 图 15-29 给 出 的 门客 户 程 序 中 ， 当 客户 的 door_call 调 用 被 一 个 捕获 
的 信号 所 中 汤 时 ， 客 户 回 服务 器 重 传 其 请 求 。 然 而 我 们 接 下 去 展示 出 这 
将 导致 相应 的 服务 器 过 程 被 调用 两 次 ， 而 不 是 一 次 。 我 们 随后 把 服务 器 
过 程 划分 成 等 势 〈 能 够 任意 多 次 无 差错 地 调用 ) 和 非 等 势 〈 例 如 从 某 个 
银行 账户 上 减 去 一 笔 费 用 ) 两 大 类 。 

过 程 调 用 可 划分 成 以 下 三 个 类 别 。 

(1) 正 好 一 次 (exactly once) : 过 程 只 能 不 多 不 少 地 执行 一 次 。 这 类 








操作 难于 实现 ， 因 为 服 

务 器 存在 月 演 的 可 能 。 

(2) 最 多 一 次 (at most once) : 过 程 根 本 不 执行 或 只 执行 一 次 。 如 
果 正 常 地 返回 到 调用 者 ， 我 们 就 知道 该 过 程 执行 了 一 次 。 然 而 如 果 是 出 
错 返 回 ， 我 们 就 不 能 肯定 该 过 程 执行 了 一 次 还 是 根本 没有 执行 。 

(3) 最 少 一 次 Cat least once) : 过 程 至 少 执行 一 次 ， 不 过 有 可 能 是 多 
次 。 这 对 于 等 势 过 程 没 有 问题 ， 客 户 只 需 一 直 传 送 其 请 求 ， 直 到 接收 到 
一 个 有 效 的 啊 应 为 止 。 然 而 如 果 客 户 非 得 不 止 一 次 地 发 送 其 请 求 以 接收 
一 个 有 效 的 啊 应 ， 那 么 该 过 程 执行 一 次 以 上 的 可 能 是 存在 的 。 

对 于 一 个 本 地 过 程 调用 ， 如 果 它 返回 ， 我 们 就 知道 它 正 好 执行 了 一 
次 ， 但 是 如 果 当 前 进程 在 调用 该 过 程 后 月 尝 ， 我 们 就 不 知道 它 到 底 执 行 
了 一 次 还 是 根本 没有 执行 。 对 于 一 个 远程 过 程 调 有 用， 我们 必须 考虑 如 下 
各 种 情形 。 

如 果 使 用 的 是 TCP 协 议 ， 而 且 接 收 到 了 一 个 应 答 ， 我 们 就 知道 该 远 
程 过 程 正好 被 调用 了 一 次 。 但 是 如 果 没 有 接收 到 应 答 〈 壁 如 说 服务 器 主 
HARET) ， 我 们 就 不 知道 该 服务 器 过 程 已 在 其 主机 骨 溃 之 前 执行 完 
毕 ， 还 是 尚未 被 调用 (最 多 一 次 的 语义 ) 。 在 服务 器 主机 可 能 骨 演 ， 而 
且 网 络 存 在 停止 运作 可 能 的 前 提 下 ， 提 供 正 好 一 次 的 语义 需要 一 个 事务 
处 理 系 统 ， 它 已 超出 了 RPC 软 件 包 的 能 

如 采 使 用 的 是 UDP 协议 ， 而 且 服 务 器 主机 没有 骨 溃 ， 应 答 也 接收 到 
了 ， 我 们 就 知道 该 服务 器 过 程 至 少 被 调用 了 一 次 ， 不 过 也 可 能 是 多 次 
(最 少 一 次 语义 ) 。 

如 果 使 用 的 是 UDP 协 议 ， 而 且 启 用 了 一 个 服务 器 高 速 绥 存 ， 应 管 也 
接收 到 了 ， 我 们 就 知道 该 服务 器 过 程 正好 被 调用 了 一 次 。 然 而 如 果 没 有 
接收 到 应 答 ， 那 就 具有 最 多 一 次 的 语义 ， 这 跟 TCP 情 形 类 似 。 

给 定 如 下 三 种 选择 : 

(1)TCP; 











缓存 ; 
缓存。 


(2)JUDP， 带 有 一 个 服务 器 高 速 

(3)UDP， 没 有 任何 服务 器 高 速 
ee n 
是 使 用 TCP， 除 非 TCP 连 接 的 开销 对 于 应 用 来 说 过 分 昂贵 。 

给 正确 执行 的 意义 相当 重大 的 非 等 势 过 程 《 例 如 银行 账户 、 机 票 预 
订 等 ) 使 用 一 个 事务 处 理 系 统 。 

对 于 非 等 势 过 程 ， 使 用 TCP 要 比 使 用 带 有 一 个 服务 器 高 速 缓存 的 
UDP 更 为 可 取 。TCP 一 开始 就 设计 成 可 靠 的 ， 而 往 一 个 UDP 应 用 中 添加 
可 靠 性 很 少 色 这 到 使 用 TCP 的 效果 (例如 UNPvI1 的 20.5 节 ) 。 

对 等 势 过 程 使 用 不 带 服务 器 高 速 缓存 的 UDP 不 成 问题 。 

? 对 非 等 势 过程 使 用 不 带 服务 器 高 速 绥 存 的 UDP 则 是 危险 的 。 

我 们 将 在 下 一 节 讨 论 使 用 TCP 的 其 他 优势 。 








现在 考虑 客户 或 服务 器 之 一 过 早 终 止 ， 而 且 使 用 TCP 作 为 传输 协议 
时 会 发 生 什 么 情况 。 既 然 UDP 是 无 连接 的 ， 因 而 打开 着 某 个 UDP 端点 的 
一 个 进程 终止 时 ， 不 会 有 任何 信息 发 送 给 对 方 。 在 使 用 UDP 的 情形 下 ， 
当 有 一 方 朋 省 时 所 发 生 的 全 部 情况 为 : 对 方 将 超时 ， 可 能 会 重 传 ， 最 终 
放弃 ， 这 是 上 一 节 中 讨论 过 的 。 然 而 ， 当 具有 某 个 打开 着 的 TCP 连 接 的 
一 个 进程 终止 时 ， 该 连接 也 终止 ， 从 而 向 对 方 发 送 一 个 FIN 分 节 
CUNPv1 第 36 一 37 页 , ， 我 们 就 想 看 一 看 当 RPC 运 行 时 系统 在 接收 到 来 
自 对 方 的 这 个 出 乎 意料 的 FIN 时 会 做 些 什 么 。 

16.7.1 服务 器 的 过 早 终止 

我 们 首先 在 服务 器 仍 在 处 理 一 个 客户 请 求 时 过 早 地 终止 它 。 对 客户 
程序 所 作 的 唯一 变动 是 : 把 图 16-2 中 clnt_create 调 用 的 “tcp” 参 数 挪 走 ， 
改 成 作为 一 个 命令 行 参数 指定 所 用 的 传输 协议 ， 就 像 图 16-12 中 的 那 


样 。 在 服务 器 过 程 中 ， 我 们 增加 一 个 abort 函 数 调用 。 该 调用 会 终止 服务 
句 进 程 ， 导 致 服务 器 主机 的 TCP 同 客户 主机 的 TCP 发 送 一 个 FIN， 这 一 
点 可 使 用 tcpdump 验 证 。 

我 们 首先 对 BSD/OS 系 统 上 的 服务 器 运行 Solaris 系 统 上 的 客户 程 
序 : 

solaris % client bsdi 22 tcp 

bsdi: RPC: Unable to receive; An event requires attention 

当 客 户主 机 接收 到 服务 器 主机 的 FIN 时 ， 其 RPC 运 行 时 系统 正在 等 
竺 服务 器 的 应 答 。 它 检测 到 这 个 非 预期 的 应 答 后 ， 从 我 们 的 
squareproc_1 调 用 返回 一 个 错误 。 该 错误 〈RPC_CANTRECV) 由 运行 时 
系统 保存 在 客户 句柄 中 ，《〈 从 我 们 的 Clnt_create 包 囊 函 数 中 ) 调用 
clnt_sperror 将 把 该 错误 输出 成 “Unable to receive 〈 无 法 接收 ) ”。 该 出 错 
消息 的 其 余部 分 “Anevent requires attention (有 一 个 事件 需要 留意 ) ”对 
应 于 由 运行 时 系统 保存 的 XTI 错 误 ， 它 也 由 clnt_sperror 输 出 。 一 个 客户 
调用 一 个 远程 过 程 时 能 够 返回 大 约 30 个 不 同 的 RPC_xxx 错 误 ， 它 们 列 在 
<Irpc/clnt_star.h> 头 文件 中 。 

对 换 客 户 和 服务 器 的 运行 主机 ， 我 们 看 到 同样 的 情形 ， 由 RPC 运 行 
时 系统 返回 同样 的 错误 (RPC_CANTRECV) ， 不 过 最 后 输出 的 消息 不 
一 样 


bsdi % client solaris 11 tcp 








solaris: RPC: Unable to receive; errno = Connection reset by peer 

上 面 我 们 中 止 的 Solaris 服 务 器 不 是 作为 一 个 多 线程 化 的 服务 器 程序 
编译 的 ， 因 此 当 我 们 调用 abort 时 ， 整 个 进程 被 终止 。 如 果 我 们 运行 一 个 
多 线程 化 的 服务 器 程序 ， 事 情 就 有 变化 ， 也 束 是 说 只 有 为 客户 的 调用 提 
供 服务 的 线程 才 终 止 。 为 迫使 这 种 情形 出 现 ， 我 们 把 abort 调 用 蔡 换 成 
pthread_exit 调 用 ， 就 像 我 们 在 图 15-25 中 对 使 用 门 的 例子 所 做 的 那样 。 
然后 在 BSD/OS 系 统 上 运行 客户 程序 ， 在 Solaris 系 统 上 运行 多 线程 化 的 











服务 器 程序 。 

bsdi % client solaris 33 tcp 

solaris: RPC: Timed out 

当 服 务 器 线程 终止 时 ， 与 客户 的 TCP 连 接 并 未 关闭 ， 也 就 是 说 它 仍 
然 在 服务 器 进程 中 保持 打开 。 因 此 ， 服 务 器 主机 没有 给 客户 发 送 FIN， 
于 是 客户 仪 仅 超 时 。 在 客户 请 求 已 发 送 给 服务 器 ， 并 且 服 务 器 主机 的 
TCP 己 确认 该 请 求 后 ， 如 果 服 务 占 主机 崩 尝 ， 那 么 我 们 将 看 到 同样 的 情 
DL. 

16.7.2 客户 的 过 早 终止 

当 一 个 RPC 客 户 在 其 使 用 TCP 的 茶 个 RPC 过 程 调用 仍 在 进展 期 间 终 
止 时 ， 客 户主 机 的 TCP 将 向 服务 器 主机 的 TCP 发 送 一 个 FIN。 我 们 的 问 
le: 服务 需 的 RPC 运 行 时 系统 是 否 检测 到 了 这 个 条 件 ， 从 而 可 能 回 服 
务 嚣 过程 发 出 通知 《回想 15.11 节 ， 当 客户 过 早 终止 时 ， 门 服务 器 线程 
被 取消 ) 。 

为 产生 这 个 条 件 ， 我 们 的 客户 程序 在 调用 服务 器 过 程 的 紧 前 调用 
alarm(3)， 我 们 的 服务 器 过 程 则 调用 sleep(6)。 “图 15-30 和 图 15-31 中 使 
用 门 的 例子 就 是 这 么 做 的 。 由 于 客户 没有 捕获 SIGALRM， 其 进程 将 在 
服务 器 的 应 答 返 回 前 约 3 秒 时 由 内 核 终止 。) 我 们 在 BSD/OS 系 统 上 运行 
客户 程序 ， 在 Solaris 系 统 上 运行 服务 器 程序 。 

bsdi % client solaris 44 tcp 





Alarm call 

在 客户 方 发 生 的 情况 是 我 们 预期 的 ， 但 在 服务 器 方 没 有 发 生 任何 特 
殊 之 事 。 服 务 器 过 程 结束 其 6 秒 钟 的 睡眠 后 返回 。 用 tcpdump 查 看 所 发 生 
的 情况 ， 我 们 看 到 以 下 情况 。 

当 客 户 终止 时 《在 启动 后 约 3 秒 时 ) ， 客 户主 机 的 TCP 向 服务 器 主 
机 的 TCP 发 送 一 个 FIN， 服 务 器 主机 的 TCP 对 它 作 了 确认 。 按 照 TCP 的 术 
语 ， 这 个 过 程 称 为 半 关 闭 (half_close， TCPv18718.515) 。 


客户 和 服务 器 启动 后 约 6 秒 时 ， 服 务 器 发 送 其 应 答 ， 该 应 答 由 服务 
器 主机 的 TCP 发 送 给 客户 。 “正如 UNPv1 第 130 一 132 页 中 讲述 的 那样 ， 
接收 到 一 个 FIN 后 通过 同一 TCP 连 接 发 送 数 据 没有 问题 ， 因 为 TCP 连 接 
是 全 双 工 的 。) 客户 主机 的 TCP 啊 应 以 一 个 RST 分 节 【〈 复 位 ) ， 因 为 客 
户 进程 已 经 终止 。 服 务 器 下 一 次 在 这 个 连接 上 读 或 写 时 将 认识 到 这 个 现 
状 ， 然 而 目前 什么 都 不 发 生 。 

我 们 汇总 一 下 本 节 探 讨 的 几 个 关键 点 。 

使 用 UDP 的 RPC 客 户 和 服务 器 永远 不 知道 对 方 是 否 过 早 终止 。 当 接 
收 不 到 响应 时 ， 它 们 可 能 超时 ， 不 过 无 法 分 辩 错 误 类 型 : 进程 过 早 终 
止 、 对 方 主机 骨 溃 、 网 络 不 可 达 ， 等 等 。 

使 用 TCP 的 客户 和 服务 器 检测 出 对 方 所 存在 问题 的 机 会 要 大 得 多 ， 
因为 对 方 进程 的 过 早 终止 自动 导致 对 方 主机 的 TCP 关 闭 其 所 在 端的 连 
接 。 但 是 如 果 对 方 是 一 个 线程 化 的 服务 器 ， 这 一 点 就 不 起 作用 ， 因 为 对 
方 线程 的 终止 并 不 会 关闭 其 所 在 端的 连接 。 另 外 这 一 点 也 无 助 于 检测 对 
方 主机 的 骨 溃 ， 因 为 发 生 这 种 情况 时 ， 对 方 主机 的 TCP 并 没 关 闭 它 的 打 
开 着 的 连接 。 为 处 理 所 有 这 些 情形 ， 超 时 机 制 仍然 是 必需 的 。 








16.8 XDR: up ZN 


使 用 前 一 章 中 讲述 的 门 从 一 个 进程 调用 另 一 个 进程 中 的 某 个 过 程 
时 ， 这 两 个 进程 处 于 同一 台 主 机 上 ， 因 而 没有 数据 转换 问题 。 但 是 对 于 
不 同 主机 间 的 RPC， 各 种 各 样 的 主机 可 能 使 用 不 同 的 数据 格式 。 首 先 ， 
各 个 基本 的 C 数 据 类 型 可 能 有 不 同 的 大 小 (例如 某 些 系统 上 long 数 据 类 
型 占据 32 位 ， 其 他 系统 上 却 占据 64 位 ) 。 其 次 ， 各 个 位 真正 的 先后 顺序 
可 能 不 一 样 〈( 也 就 是 大 端 字 节 序 和 小 端 字 节 序 的 差异 ， 我 们 在 UNPvV1 第 
66 一 69 页 和 第 137 一 140 页 [8] 中 讨论 过 ) 。 我 们 已 随 图 16-3 碰 到 过 这 个 
问题 ， 那 时 我 们 在 小 端 字 节 序 的 x86 系 统 上 运行 服务 器 程序 ， 在 大 端 字 











节 序 的 Sparc 系 统 上 运行 客户 程序 ， 然 而 这 样 的 两 台 主 机 之 间 仍 能 正确 
地 交换 长 整数 。 

Sun RPC 使 用 XDR 即 外 部 数据 表示 (External Data Representation) 
标准 来 描述 和 编码 数据 (RFC 1832 [Srinivasan 1995b] ) 。XDR 既 是 
一 种 用 于 摘 述 数据 的 语言 ， 又 是 一 组 用 于 编码 数据 的 规则 。XDR 使 用 隐 
式 类 型 指定 Cimplicit typing) 方式 ， 它 意味 着 发 送 者 和 接收 者 都 得 知道 
数据 的 类 型 和 字 节 序 : 例如 两 个 32 位 整数 值 后 跟 一 个 单 精度 浮 点 数值 ， 
再 跟 一 个 字符 串 。 

作为 比较 ， 在 OSI 领域 中 ASN.1《〈 抽 象 语法 表示 1，Abstract Syntax 
Notation one) 是 描述 数据 的 通 沼 方式 ，BER (基本 编码 规则 ，Basic 
Encoding Rules) 是 一 种 编码 数据 的 党 用 方式 。 这 种 方案 还 使 用 显 式 类 
型 指定 Cexplicit typing) 方式 ， 它 意味 着 每 个 数据 值 之 前 冠 以 描述 所 跟 
数据 之 类 型 的 某 个 值 〈 称 为 “指定 符 Cspecifier) ”) 。 对 应 刚才 这 个 例 
子 的 字 节 流 按 顺序 含有 以 下 各 个 字段 : 说 下 一 个 值 是 一 个 整数 的 指定 
符 、 整 数值 、 说 下 一 个 值 是 一 个 整数 的 指定 符 、 整 数值 、 说 下 一 个 值 是 
一 个 浮 点 数 的 指定 符 、 浮 点 数值 、 说 下 一 个 值 是 一 个 字符 串 的 指定 符 、 
字符 串 。 

所 有 数据 类 型 的 XDR 表 示 都 需要 4 的 倍数 的 字 节 数 ， 这 些 字 节 总 是 
以 大 端 字 市 序 传送 的 。 带 符号 整数 值 使 用 二 进 制 补 码 Ctwo's 
complement)〉 记 法 存放 ， 浮 点 数值 则 使 用 IEEE 格 式 存放 。 可 变 长 度 字 段 
总 是 在 其 末端 含有 最 多 3 个 字 节 的 填充 ， 这 样 下 一 个 条 目 总 是 落 在 某 个 4 
字 节 的 边界 。 例 如 一 个 5 字 节 的 ASCII 字 符 串 将 作为 12 个 字 节 来 传送 : 

一 个 4 字 节 的 整数 计数 ， 其 值 为 5; 

5 字 节 的 字符 串 本 号 ; 

3 个 字 节 的 值 为 0 的 填充 。 

在 讲述 XDR 和 它 文 持 的 数据 类 型 时 ， 我 们 考虑 以 下 三 个 问题 。 

(1) 如 何在 RPC 说 明 书 文件 (.x 文 件 ) 中 给 rpcgen 声 明 各 种 类 型 的 变 





























t? 到 此 为 止 的 唯一 一 个 例子 “图 16-1) 只 使 用 一 个 长 整数 。 

(2)rpcgen 把 定义 在 .x 文件 中 的 变量 转换 成 自己 产生 的 .hb 头 文件 中 的 
哪 一 种 C 数 据 类 型 ? 

(3) 所 传送 数据 的 真正 格式 是 什么 ? 

图 16-14 回 答 了 前 两 个 问题 。 为 产生 这 张 表格 ， 我 们 创建 了 一 个 
RPC 说 明 书 文件 ， 它 用 到 了 所 有 受 文 持 的 XDR 数 据 类 型 。 该 文件 通过 
rpcgen 运 行 后 ， 我 们 查看 所 产生 的 C 头 文件 从 而 构造 出 该 表格 。 








|1 | const name= value; |  $definename value 
typedef declaration; typedef declaration; 
3 


char var; char var; 

short var; short var; 

int var; int var; 

long var; long var; 

hyper var; longlong t var; 
unsigned char var; u char var; 
unsigned short var; u short var; 
unsigned int var; u int var; 
unsigned long var; u long var; 
unsigned hyper var; u longlong t var; 


5 float var; float var; 
double var; double var; 
quadruple var; quadruple var; 


| 6 | boolva; | bool tva; — | 


enum var { name = const, ... ); enum var ( name = const, ... ); 
typedef enum var var ; 
opaque var([n] ; char var [n] ; 


opaque var«m»; struct ( 
u intvar len; 
char *var val; 
var ; 


datatype var [n] ; datatype var [n] ; 


struct var ( members ... ); struct var ( members ... ); 
typedef struct var var;e 


union var switch (int disc) ( struct var { 
case discvalueA: armdeclA ; int disc; 
case discvalueB: armdeclB ; union { 


ka armdeclA ; 
default: defaultdecl ; armdeclB ; 


^ defaultdecl ; 
var u; 


E struct var var; 
图 16-14 XDR 和 rpcgen 支 持 的 数据 类 型 的 汇总 
我 们 现在 详细 描述 各 个 表 项 ， 并 以 第 一 栏 中 给 出 的 顺序 号 〈1 一 
150 指称 它们 。 





12 datatype var<m> ; struct { 
u_int var_len; 
datatype *var_val; 
} var; 


(1)const 声 明 转 换 成 C 的 #define。 

(2)typedef 声 明 转 换 成 C 的 typedef。 

(3) 这 些 是 总 共 5 个 的 带 符 号 整数 数据 类 型 。 其 中 前 4 个 是 由 XDR 作 
为 32 位 值 传 送 的 ， 最 后 一 个 是 由 XDR 作 为 64 位 值 传送 的 。 

对 于 许多 C 编 译 占 来 说 ，64 位 整数 的 类 型 为 long long int 或 long 
long。 然 而 不 是 所 有 的 编译 器 和 操作 系统 都 支持 它们 。 既 然 所 生成 的 .h 
文件 声明 这 样 的 C 变 量 的 类 型 为 Jonglong t， 因 此 某 个 头 文 件 中 必须 有 如 
下 的 定义 : 

typedef long long longlong t; 

XDR 的 long 类 型 占据 32 位 ， 但 是 64 位 Unix 系 统 上 的 C 语 言 long 类 型 
占据 64 位 (例如 UNPv1 第 27 页 [9] 描述 的 LP64 模 型 )。 这 些 10 年 前 的 
XDR 和 名 字 在 当今 的 世界 中 确实 是 不 科 的 。 更 好 的 名 字 可 能 是 int8_t、 
int16_t、int32_t、int64_t 等 。 

(4) 这 些 是 总 共 5 个 的 无 符号 整数 数据 类 型 。 其 中 前 4 个 是 由 XDR 作 
为 32 位 值 传 送 的 ， 最 后 一 个 是 由 XDR 作 为 64 位 值 传送 的 。 

(5) 这 些 是 总 共 3 个 的 浮 点 数 数据 类 型 。 其 中 第 一 个 作为 32 位 值 传 
送 ， 第 二 个 作为 64 位 值 传送 ， 第 三 个 作为 128 位 值 传 送 。 

四 精度 浮 点 数 在 C 语 言 中 的 类 型 为 Iong ” double。 然而 不 是 所 有 的 编 
译 右 和 操作 系统 都 支持 它们 。【〔 你 的 编译 器 也 许 人 允许 long double， 但 只 
是 把 它 作 为 double 类 型 处 理 。) 由 于 所 生成 的 .h 文 件 声明 这 样 的 C 变 量 的 
类 型 为 quadruple， 因 此 某 个 头 文件 中 必须 有 如 下 的 定义 : 

typedef long double quadruple; 

举例 来 说 ，Solaris 2.6 下 我 们 必须 在 .x 文件 的 开始 处 包含 如 下 的 行 : 

%#include <floatingpoint.h> 

因为 该 头 文 件 包 含 了 所 需 的 定义 。 该 行 开头 的 百 分 号 告诉 rpcgen 把 
本 行 剩余 部 分 原封 不 动 地 放 入 所 产生 的 .h 头 文件 中 。 

(6) 布 尔 〈boolean ) 数据 类 型 与 一 个 带 符 号 整数 等 效 。RPC 头 文件 























同时 定义 常 值 TRUE 为 1， 常 值 FALSE 为 0。 

(7) 一 个 枚 举 Cenumeration) 数据 类 型 与 一 个 带 符号 整数 等 效 ， 且 跟 
C 语 言 的 enum 数 据 类 型 一 样 。rpcgen 还 给 所 指定 的 变量 名 产生 一 个 
typedef 定 义 。 

(8) 固 定 长 度 不 透明 数据 (fixed-length opaque data) 是 作为 8 位 值 传 
送 的 确定 数目 On 的 字 节 ， 运 行 时 函数 库 不 解释 它 。 

(9) 可 变 长 度 不 透明 数据 (variable-length opaque data) 也 是 作为 8 位 
值 传送 的 不 作 解 释 的 一 个 字 节 序列 ， 不 过 真正 的 字 节 数 是 作为 一 个 无 符 
写 整数 先 于 数据 传送 的 。 发 送 这 种 类 型 的 数据 时 例如 先 于 某 个 RPC 调 
用 填写 传递 给 它 的 参数 时 ) ， 应 在 发 出 调用 之 前 设置 长 度 。 接 收 这 种 类 
型 的 数据 时 ， 必 须 检 查 其 长 度 以 确定 后 跟 多 少数 据 。 

声明 中 的 最 大 长 度 m 可 被 忽略 。 但 是 如 果 编 译 时 指定 了 长 度 ， 那 么 
运行 时 函数 库 将 检查 真正 的 长 度 〈 我 们 作为 相应 C 结 构 的 var_len 成 员 给 
出 的 内 容 ) 没有 超过 mm 的 值 。 

(10) 一 个 字符 串 〈string) 是 一 个 ASCII 字 符 序 列 。 字 符 串 在 内 存 中 
是 作为 一 个 普通 的 以 空 字 符 结尾 的 C 字 符 串 存放 的 ， 但 在 传输 中 却 冠 以 

个 指定 后 跟 字 符 实 际 数目 《不 包括 结尾 的 空 字符 ) 的 无 符号 整数 。 发 
送 这 种 类 型 的 数据 时 ， 运 行 时 系统 通过 调用 strlen 确 定 字 符 数 。 接 收 这 
种 类 型 的 数据 时 ， 它 是 作为 一 个 以 空 字 符 绪 尾 的 C 字 符 串 存放 的 。 

声明 中 的 最 大 长 度 m 可 被 忽略 。 但 是 如 果 编 译 时 指定 了 长 度 ， 那 么 
运行 时 函数 库 将 检查 真正 的 长 上 度 没 有 超过 m 的 值 。 

(11) 一 个 任意 数据 类 型 的 固定 长 度数 组 (fixed-length array) 是 作为 
该 数据 类 型 的 一 个 n 个 元 素 的 序列 传送 的 。 

(12) 一 个 任意 数据 类 型 的 可 变 长 度数 组 (variable-length array) 作为 
虽 定 该 数组 中 实际 元 素数 目的 一 个 无 符号 整数 以 及 后 跟 的 各 个 数组 元 素 
传送 。 

声明 中 的 最 大 长 度 m 可 被 忽略 。 但 是 如 果 编 译 时 指定 了 长 度 ， 那 么 









































运行 时 函数 库 将 检查 真正 的 长 度 没 有 超过 m 的 值 。 

(13) 一 个 结构 (structure〉 是 通过 轮流 传送 其 各 个 成 员 来 传送 的 。 
rpcgen 还 给 所 指定 的 变量 名 产生 一 个 typedef 定 义 。 

(14) 一 个 带 判 别 式 的 联合 (discriminated union) 由 一 个 整数 判别 式 
后 跟 基 于 该 判别 式 的 值 的 一 组 数据 类 型 〈 称 为 分 文 Carm? ) 构成 。 在 
图 16-14 中 给 出 的 判别 式 是 一 个 int， 但 它 也 可 以 是 一 个 unsigned int、 一 
个 enum 或 一 个 bool( 所 有 这 些 判 别 式 都 作为 一 个 32 位 整数 值 传送 ) 。 传 
送 一 个 带 判别 式 的 联合 时 ， 其 判别 式 的 32 位 值 首先 传送 ， 然 后 传送 对 应 
于 该 判别 式 的 值 的 唯一 一 个 分 支 值 。 这 种 联合 的 default 声 明 往往 是 
void， 它 的 意思 是 在 判别 式 的 32 位 值 之 后 不 跟 任 何 数据 。 我 们 稍 后 给 出 
EH — AF 

(15) 可 选 数据 (optional data) 是 一 种 特殊 类 型 的 联合 ， 我 们 将 随 图 
16-24 中 给 出 的 一 个 例子 描述 它 。 这 种 数据 类 型 的 XDR 声 明 看 着 像 是 一 
个 C 指 针 声 明 ， 它 就 是 所 生成 的 .h 文 件 所 包含 的 内 容 。 

图 16-15 汇 总 了 XDR 给 它 的 各 种 数据 类 型 采用 的 编码 格式 。 

16.8.1 例子 : 不 涉及 RPC 使 用 XDR 

现在 给 出 一 个 不 涉及 RPC 使 用 XDR 的 例子 。 也 就 是 说 ， 我 们 将 使 用 
XDR 把 一 个 二 进 制 数据 的 结构 编码 成 一 种 可 在 其 他 系统 上 加 以 处 理 的 机 
器 无 关 表 示 。 这 种 技巧 可 用 于 以 一 种 与 机 器 无 关 的 格式 书写 文件 ， 或 者 
以 一 种 与 机 器 无 关 的 格式 通过 网 络 向 另 一 台 计 算 机 发 送 数据 。 图 16-16 
给 出 了 我 们 的 RPC 说 明 书 文件 data.x， 它 实际 上 只 是 一 个 XDR 说 明 书 文 
件 ， 因 为 我 们 没有 声明 任何 RPC 过 程 。 

文件 名 后 级 .x 来 自 “XDR 说 明 书 文件 ”一 词 。RPC 规 范 (RFC 1831) 
中 说 ， 有 时 称 为 RPCL 的 RPC 语 言 与 XDR 语 言 (在 RFC 1832 中 定义 ) Æ 
本 相同 ， 差 别 只 是 后 者 增加 了 程序 定义 〈 用 于 描述 程序 、 版 本 和 过 
FE) 

声明 枚 举 和 带 判 别 式 的 联合 











1~11 声明 一 个 共有 两 个 值 的 枚 举 数 据 类 型 ， 后 跟 一 个 把 该 枚 举 类 
型 作为 判别 式 的 带 判别 式 联 合 。 如 果 该 判别 式 的 值 为 RESULT INT, H 
么 在 该 判别 式 的 值 之 后 传送 的 是 一 个 整数 值 。 如 果 该 判别 式 的 值 为 
RESULT_DOUBLE， 那 么 在 该 判别 式 的 值 之 后 传送 的 是 一 个 双 精 度 浮 
点 数值 。 否 则 的 话 ， 在 该 判别 式 的 值 之 后 不 传送 任何 数据 。 

声明 结构 


12~21 声明 一 个 包含 多 个 XDR 数 据 类 型 的 结构 。 


unsigned char, short. unsigned short, 
char: LIII Je unsigned int. long. unsigned long, 
boo1 和 enun 的 编码 格式 相同 
23 3 


MSB LSB 


hyper: LI TITITII unsigned hyper 的 编码 格式 相同 


4s 0 Li 2 3 4 5 6 7 


1 位 符号 
Fi. EET 8 位 指数 部 分 
23 位 小 数 部 分 


2wo I3 3j 
1 位 符号 
iie 52 位 小 数 部 分 
oH 
1 位 符号 


quadruple: 15 位 指数 部 分 


z» 0 1.2 3 4 35 6 7 8 9 0] i 12 D 14 15 112 位 小 数 部 分 


A—— ———— 


指数 小 数 


opaque ies : LL ESL BI] 固定 长 度 不 透明 数据 


字 节 0 1 HT ue 
使 用 Cntr) mod 4=0 的 7 个 字 节 


Gpagüe «m»: [eg] D E TT [elo] 可 变 长 度 不 透明 数据 
1 


0 m-l 
4 字 节 使 用 (mtr ) mod 4 = 0 的 个 字 闻 


ses e Pde m 
1 


0 A VEEE 


4 字 节 使 用 (mtr) mod4= 0 的 个 字 节 


每 个 元 素 的 大 小 是 4 字 节 的 倍数 























4E 每 个 元 素 的 大 小 是 4 字 节 的 倍数 
union: ai 判别 式 m 所 隐 指 的 分 支 
4 字 节 分 支 的 大 小 是 4 字 节 的 倍数 


图 16-15 XDR 给 它 的 各 种 数据 类 型 采用 的 编码 格式 
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Hm 


enum result t { 
RESULT INT - 1, RESULT DOUBLE - 2 


LT 


union union arg switch (result t result) { 
case RESULT INT: 
int intval; 
case RESULT DOUBLE: 
double doubleval; 
default: 
void; 
F; 


12 struct data { 


w N 


rFPoOoWU MANA œ 


PR 


13 short short arg; 

14 long long arg; 

15 string vstring arg«128»; /* variable-length string */ 
16 opaque fopaque arg[3];  /* fixed-length opaque */ 

17 opaque vopaque arg«»; /* variable-length opaque */ 

18 short fshort arg[4]; /* fixed-length array */ 

19 long vlong arg«»; /* variable-length array */ 

20 union arg uarg; 

21 }; 
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16-16 XDR 说 明 书 文件 


既然 data.x 没 有 声明 任何 RPC 过 程 ， 当 查看 图 16-4 中 由 rpcgen 产 生 的 
所 有 文件 时 ， 我 们 看 到 rpcgen 并 没有 产生 客户 程序 存根 和 服务 器 程序 存 
根 。 不 过 它 仍然 产生 了 data.h 头 文件 和 data_xdr.c 文 件 ， 其 中 data_xdr.c 含 
有 用 于 编码 或 解码 在 我 们 的 data.x 文 件 中 所 声明 数据 条 目的 XDR 函 数 。 

图 16-17 给 出 了 所 产生 的 data.h 头 文件 。 按 照 图 16-14 中 给 出 的 转换 规 
则 ， 该 头 文 件 的 内 容 正 是 我 们 所 预期 的 。 





/ * 
* Please do not edit this file. It was generated using rpcgen. 
*/ 

#ifndef DATA H RPCGEN 


#define DATA H RPCGEN 


enum result t ( 
RESULT INT - 1, 
RESULT DOUBLE - 2 


typedef enum result t result t; 


struct union arg ( 
result t result; 
union ( 
int intval; 
double doubleval; 
) union arg u; 
}; 


typedef struct union arg union arg; 


struct data { 
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图 16-17 由 rpcgen 从 图 16-16 产 生 的 头 文件 





20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
S 
32 
33 
34 
35 


36 
37 
38 
39 


40 


short short arg; 
long long arg; 
char *vstring arg; 
char fopaque arg[3]; 
struct { 
u int vopaque arg len; 
char *vopaque arg val; 
} vopaque arg; 
short fshort arg[4]; 
struct ( 
u int  vlong arg len; 
long *vlong arg val; 
} vlong arg; 
union arg uarg; 
}; 


typedef struct data data; 


/* the xdr functions */ 
extern bool_t xdr result t(XDR *, result t*); 
extern bool t xdr union arg(XDR *, union arg*); 
extern bool t xdr data(XDR *, data*); 


#endif /* ! DATA H RPCGEN */ 


图 16-17 (42) 


在 data_xdr.c 文 件 中 定义 了 一 个 名 为 xdr_data 的 函数 ， 
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我 们 可 调用 它 


来 编码 或 解码 已 定义 的 data 结 构 的 内 容 。〔 函 数 名 后 级 _data 来 自 图 16-16 
中 所 定义 结构 的 名 字 。) 我 们 编写 的 第 一 个 程序 的 文件 名 为 write.c， 它 
设置 data 结 构 中 所 有 变量 的 值 ， 调 用 xdr_data 函 数 把 所 有 字段 编码 成 
XDR 格 式 ， 然 后 把 结果 写 往 标准 输出 。 

图 16-18 给 出 了 这 个 程序 。 

把 结构 成 员 设置 成 某 个 非 零 值 

12—32 首先 把 data 结 构 的 所 有 成 员 设 置 成 某 个 非 零 值 。 对 于 可 变 长 
度 成 员 ， 我 们 必须 设置 一 个 计数 以 及 这 个 数目 的 值 。 对 于 带 判 别 式 的 联 
合 ， 我 们 将 判别 式 的 值 设置 为 RESULT_INT， 对 应 的 结果 整数 值 为 
123。 

分 配 适 当地 对 齐 的 绥 冲 区 

33 调用 malloc 分 配 XDR 例 程 将 往 其 中 存 入 数据 的 缓冲 区 空间 。 由 于 
该 缓冲 区 必须 在 某 个 

4 字 节 的 边界 上 对 齐 ， 因 此 简单 地 静态 分 配 一 个 char 数 组 不 能 保证 
这 种 对 齐 要 求 。 

创建 XDR 内 存 流 

34 ”运行 时 库 函 数 xdrmem_create 把 由 buff 指 癌 的 缓冲 区 初始 化 成 供 
XDR 用 作 一 个 内 存 流 。 我 们 分 配 一 个 名 为 xhandle 的 XDR 类 型 的 变量 ， 
并 把 该 变量 的 地 址 作为 第 一 个 参数 传递 给 该 函数 。XDR 运 行 时 系统 在 这 
个 变量 中 维护 相关 信息 〈 绥 冲 区 指针 、 绥 冲 区 中 的 当前 位 置 等 ) 。 最 后 
一 个 参数 是 XDR_ENCODE， 它 告诉 XDR 我 们 需 从 主机 格式 (我 们 的 out 
结构 ) 转换 成 XDR 格 式 。 

编码 结构 

35—36 调用 由 rpcgen 在 data_xdr.c 文 件 中 生成 的 xdr_data 函 数 ， 它 把 
out 结 构 编 码 成 XDR 格 式 。 返 回 值 为 TRUE 表示 成 功 。 
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1 #include "unpipc.h" 

2 #include "data.h" 

3 int 

4 main(int argc, char **argv) 

5 { 

6 XDR xhandle; 

7 data out; /* the structure whose values we store */ 
8 char *buff; /* the result of the XDR encoding */ 
9 char vop [2] ; 

10 long vlong[3]; 

11 u int size; 

12 out.short arg - 1; 

13 out.long arg - 2; 

14 out.vstring arg = "hello, world"; /* pointer assignment */ 
15 out.fopaque arg[0] = 99; /* fixed-length opaque */ 

16 out.fopaque arg[1] - 88; 

17 out.fopaque arg[2] - 77; 

18 vop[0] = 33; /* variable-length opaque */ 
19 vop[1] = 44; 
20 out.vopaque arg.vopaque arg len - 2; 
21 out.vopaque arg.vopaque arg val - vop; 
22 out.fshort arg[0] = 9999; /* fixed-length array */ 
23 out.fshort arg[1] - 8888; 
24 out.fshort arg[2] - 7777; 
25 out.fshort arg[3] - 6666; 
26 vlong[0] = 123456; /* variable-length array */ 
27 vlong[1] = 234567; 
28 vlong[2] = 345678; 
29 out.vlong arg.vlong arg len - 3; 
30 out.vlong arg.vlong arg val - vlong; 

31 out.uarg.result - RESULT INT; /* discriminated union */ 

32 out.uarg.union arg u.intval - 123; 

33 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
34 xdrmem create(&xhandle, buff, BUFFSIZE, XDR ENCODE); 
35 if (xdr data(&xhandle, &out) !- TRUE) 

36 err quit("xdr data error"); 

37 size = xdr getpos (&xhandle); 

38 Write(STDOUT FILENO, buff, size); 

39 exit(0); 
40 ) 
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116-18 初始 化 data 结 构 并 以 XDR 格 式 将 它 写 出 


获取 编码 后 数据 的 大 小 并 write 
37~38 函数 xdr_getpos 返 回 XDR 运 行 时 系统 在 输出 缓冲 区 中 的 当前 








位 置 ( 也 就 是 待 存 入 的 下 一 个 字 节 的 字 节 偏 移 、 ， 我 们 用 它 作 为 write 调 
用 的 长 度 参数 。 

图 16-19 给 出 了 我 们 的 read 程 序 ， 它 读 入 由 前 一 个 程序 写 出 的 文件 ， 
输出 data 结 构 所 有 成 员 的 值 。 
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1 #include "unpipc.h" 

2 #include "data.h" 

3 unt 

4 main(int argc, char **argv) 

5 { 

6 XDR xhandle; 

7; int i; 

8 char *buff; 

9 data in; 

10 ssize t n; 

11 buff = Malloc (BUFFSIZE); /* must be aligned on 4-byte boundary */ 
12 n - Read(STDIN FILENO, buff, BUFFSIZE); 

13 printf("read $1d bytes\n", (long) n); 

14 xdrmem create(&xhandle, buff, n, XDR DECODE); 

15 memset(&in, 0, sizeof(in)); 

16 if (xdr data(&xhandle, &in) !- TRUE) 

17 err quit("xdr data error"); 

18 printf("short arg = $d, long arg = %ld, vstring arg = '%s'\n", 
19 in.short arg, in.long arg, in.vstring arg); 
20 printf("fopaque[] = %d, %d, %d\n", 
2. in.fopaque arg[0], in.fopaque arg[1], in.fopaque arg[21); 
22 printf ("vopaque<> ="); 
23 for (i = 0; i < in.vopaque arg.vopaque arg len; i++) 

24 printf(" $d", in.vopaque arg.vopaque arg val[i]); 

25 printf ("WM"); 
26 printf("fshort arg[] = $d, $d, $d, $dWMn", in.fshort arg[0], 
27 in.fshort arg[1], in.fshort arg[2], in.fshort arg[31); 
28 printf ("vlong<> ="); 

29 for (i = 0; i < in.vlong arg.vlong arg len; i++) 

30 printf(" $1d", in.vlong arg.vlong arg val [i]); 

31 printf ("Mn"); 

32 switch (in.uarg.result) { 

33 case RESULT_INT: 

34 printf ("uarg (int) = %d\n", in.uarg.union arg u.intval); 
35 break; 

36 case RESULT_DOUBLE: 

37 printf ("uarg (double) = %g\n", in.uarg.union arg u.doubleval); 
38 break; 

39 default: 
40 printf ("uarg (void) Wn"); 
41 break; 
42 } 
43 xdr free(xdr data, (char *) &in); 
44 exit (0); 
45 ) 





图 16-19 读 入 XDR 格 式 的 data 结 构 并 输出 其 值 
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分 配 适 当 对 齐 过 的 缓冲 区 

11~13 调用 malloc 分 配 一 个 适当 对 齐 过 的 缓冲 区 ， 把 由 前 一 个 程序 
生成 的 文件 读 入 该 缓冲 区 。 

创建 XDR 内 存 流 ， 初 始 化 缓冲 区 ， 然 后 解码 

14—17 初始 化 一 个 XDR 内 存 流 ， 这 次 指定 XDR_DECODE 以 指示 我 
们 希望 从 XDR 格 式 转换 成 主机 格式 。 把 我 们 的 in 结 构 初 始 化 为 0 后 调用 
xdr_data， 从 而 把 缓冲 区 buff 中 的 数据 解码 到 in 结 构 中 。 我 们 必须 把 XDR 
目的 地 《in 结构 ) 初始 化 为 0， 因 为 有 些 XDR 例 程 〈 例 如 xdr_string) 需 
要 这 样 做 。xdr_data 与 我 们 从 图 16-18 中 调用 的 同名 函数 是 一 样 的 ， 有 变 
化 的 是 xdrmem_create 的 最 后 一 个 参数 : 前 一 个 程序 中 指定 的 是 
XDR_ENCODE， 本 程序 中 指定 的 是 XDR_DECODE。 该 值 由 
xdrmem_create 保 存在 XDR 人 句柄 (xhandle) 中 ， XDR 运 行 时 系统 就 用 它 
来 确定 是 编码 数据 还 是 解码 数据 。 

输出 结构 的 值 

18 一 42 输出 我 们 的 data 结 构 的 所 有 成 员 的 值 。 

释放 由 XDR 分 配 的 任何 内 存 空间 

43 ”调用 xdr_free 释 放 XDR 运 行 时 系统 可 能 已 动态 分 配 的 内 存 空间 

(参见 习题 16.10) 。 

我 们 在 一 台 Sparc 主 机 上 运行 write 程 序 ， 并 把 标准 输出 重新 定 同 到 

一 个 名 为 data 的 文件 : 


solaris % write > data 

















solaris % Is -] data 

-rw-rw-r-- 1 rstevens other1 76 Apr 23 12:32 data 

我 们 看 到 文件 大 小 为 76 字 节 ， 这 跟 图 16-20 是 对 应 的 ， 该 图 详细 展 
示 了 数据 的 存放 情况 〈19 个 4 字 节 值 ) 。 





short 
long 


string <128> 


opaque [3] 


opaque <> 


short [4] 








图 16-20 由 图 16-18 写 出 的 XDR 流 的 格式 
在 BSD/OS 或 Digital Unix 下 读 这 个 二 进 制 文件 ， 结 果 跟 我 们 预料 的 
一 致 : 
bsdi % read < data 
read 76 bytes 
short. arg = 1,long_arg = 2,vstring_arg = 'hello,world' 


fopaque[] = 99,88,77 

vopaque<> = 33 44 

fshort_arg[] = 9999,8888,7777,6666 

vlong<> = 123456 234567 345678 

uarg (int)= 123 

alpha % read < data 

read 76 bytes 

short arg = 1,long arg = 2,vstring arg = 'hello,world' 

fopaque[] = 99,88,77 

vopaque<> = 33 44 

fshort_arg[] = 9999,8888,7777,6666 

vlong<> = 123456 234567 345678 

uarg (int)= 123 

16.8.2 例子 : 计算 缓冲 区 的 大 小 

在 前 一 个 例子 中 我 们 分 配 了 一 个 长 度 为 BUFFSIZE 该 常 值 在 图 C-1 
给 出 的 unpipc.h 头 文件 中 定义 为 8192) 的 缓冲 区 ， 它 的 大 小 足够 了 。 不 
幸 的 是 ， 没 有 一 种 简单 方法 来 计算 XDR 为 一 个 给 定 的 结构 编码 所 需 的 总 
大 小 。 只 计算 该 结构 的 sizeof 值 是 不 对 的 ， 因 为 该 结构 的 每 个 成 员 由 
XDR 分 别 编码 。 我 们 必须 逐个 成 员 地 允 历 这 个 结构 ， 把 XDR 将 用 于 编 
码 各 个 成 员 的 大 小 加 在 一 起 。 举 例 来 说 ， 图 16-21 给 出 了 一 个 有 3 个 成 员 
的 结构 。 
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1 const MAXC = 4; 


2 struct example ( 

3 short a; 
double b; 

short c [MAXC] ; 


nw e 


s 
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图 16-21 一 个 简单 结构 的 XDR 说 明 书 文件 








图 16-22 给 出 的 程序 计算 出 XDR 编 码 这 个 结构 所 需 的 字 节 数 为 28。8 
一 9 宏 RNDUP 定 义 在 <rpc/xdr.h> 尖 文件 中 ， 它 把 它 的 参数 同上 舍 入 到 下 
一 个 BYTES_PER_XDR_UNIT (4) 的 倍数 。 对 于 一 个 固定 长 度 的 数 
组 ， 使 用 该 宏 计 算出 每 个 元 素 的 大 小 后 乘 以 元 素数 即 可 。 
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1 #include "unpipc.h" 

2 #include "example.h" 

3 int 

4 main(int argc, char **argv) 

& { 

6 int size; 

7 example foo; 

8 size = RNDUP(sizeof(foo.a)) + RNDUP(sizeof(foo.b)) + 
9 RNDUP (sizeof (foo.c[0])) * MAXC; 
10 printf ("size = %d\n", size); 
11 exit (0); 
12 } 





图 16-22 计算 XDR 编 码 所 需 字 节 数 的 程序 

这 种 技巧 的 问题 出 在 可 变 长 度数 据 类 型 上 。 如 果 我 们 声明 string 
d<10>， 那 么 所 需 的 最 大 字 节 数 为 RNDUP(sizeof(inD)〈 用 于 存放 长 度 ) 
加 上 RNDUP(sizeof(chanm*10)《〈 用 于 存放 字符 ) 。 但 是 我 们 无 法 计算 不 
带 最 大 值 的 可 变 长 度数 据 类 型 的 大 小 ， 例 如 float e<>。 最 简单 的 办 法 是 
分 配 一 个 应 该 足够 大 的 缓冲 区 ， 并 检查 XDR 例 程 的 失败 情况 (参见 习题 
16.5) 。 

16.8.3 例子 : 可 选 数据 

XDR 说 明 书 文件 中 有 三 种 指定 可 选 数 据 的 方式 ， 图 16-23 给 出 了 所 
有 这 三 种 方式 。 
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1 union optlong switch (bool flag) { 
case TRUE: 
long val; 
case FALSE: 
void; 
hs 


struct args { 
optlong argl; /* union with boolean discriminant */ 
long arg2<1>; * variable-length array with one element */ 
long *arg3; * pointer */ 


} ; 


n^ 


eH Oo wo J nM FW IN 
~ 


PR 
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图 16-23 展示 三 种 指定 可 选 数据 的 方式 的 XDR 说 明 书 文件 

声明 一 个 带 布尔 型 判别 式 的 联合 

1~8 定义 一 个 带 TRUE 和 FALSE 两 个 分 支 的 联合 ， 并 把 某 个 结构 成 
员 定 义 为 该 类 型 。 当 判别 式 flag 为 TRUE 时 ， 后 跟 的 是 一 个 long 类 型 的 
值 ， 否 则 什么 都 不 跟 。XDR 运 行 时 系统 编码 该 参数 时 ， 它 将 被 编码 成 以 
下 两 种 格式 之 一 : 

? 值 为 1 (TRUE) 的 4 字 节 标志 后 跟 一 个 4 字 节 的 值 ; 

? 值 为 0 (FALSE) 的 4 字 节 标志 。 

声明 可 变 长 度数 组 

9 指定 一 个 最 多 一 个 元 素 的 可 变 长 度数 组 时 ， 它 将 被 编码 成 以 下 两 
种 格式 之 一 : 

值 为 1 的 4 字 节 长 度 后 跟 一 个 4 字 市 的 值 ; 

值 为 0 的 4 字 节 长 度 。 

声明 XDR 指 针 

10 成员 arg3 展 示 了 指定 可 选 数据 的 一 种 新 方式 〈 它 对 应 于 图 16-14 
中 的 最 后 一 行 ) 。 该 参数 将 被 编码 成 以 下 两 种 格式 之 一 : 

值 为 1 的 4 字 节 标志 后 跟 一 个 4 字 节 值 ; 

? 值 为 0 的 4 字 节 标志 。 

这 具体 取决 于 编码 数据 时 相应 的 C 指 针 的 值 。 如 果 该 指针 非 空 ， 那 
就 使 用 第 一 种 编码 格式 〈8 个 字 节 ) ， 否 则 使 用 第 三 种 编码 格式 (4 个 字 























节 的 0) 。 当 一 个 可 选 数据 在 代码 中 是 通过 指针 来 访问 时 ， 这 是 编码 该 
数据 的 较为 便利 的 方式 。 

使 得 前 两 个 声明 产生 同样 的 编码 格式 的 一 个 实现 上 的 细 市 是 TRUE 
的 值 为 1， 它 恰好 是 只 有 一 个 元 素 的 可 变 长 度数 组 的 长 度 。 

图 16-24 给 出 了 由 rpcgen 为 这 个 说 明 书 文件 产生 的 .h 文 件 。 

14—21 尽管 所 有 三 个 参数 都 将 由 XDR 运 行 时 系统 编码 成 同样 的 格 
式 ， 在 C 代 码 中 设置 和 取出 它们 的 值 的 方法 却 各 不 相同 。 

图 16-25 是 一 个 简单 的 程序 ， 它 设置 上 述 所 有 三 个 参数 的 值 ， 使 得 
其 编码 中 没有 一 个 long 类 型 的 值 出 现 。 





sunrpc/xdr l/opt l.h 





7 struct optlong ( 


8 int flag; 

9 union { 

10 long val; 
11 ) optlong u; 

12i M 


13 typedef struct optlong optlong; 


14 struct args ( 


15 optlong argl; 

16 struct ( 

17 u int  arg2 len; 
18 long *arg2 val; 
19 ) arg2; 

20 long *arg3; 

21 } 


22 typedef struct args args; 
sunrpc/xdr 1/opt l.h 


图 16-24 由 rpcgen 给 图 16-23 产 生 的 C 头 文件 





sunrpc/xdr l/opt1z.c 


1 #include "unpipc.h" 

2 #include "goti.h" 

3 int 

4 main(int argc, char **argv) 

5 { 

6 int i; 

7 XDR xhandle; 

8 char *buff; 

9 long *lptr; 

10 args out; 

11 size t size; 

12 out.argl.flag - FALSE; 

13 out.arg2.arg2 len = 0; 

14 out.arg3 - NULL; 

15 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
16 xdrmem create(&xhandle, buff, BUFFSIZE, XDR ENCODE); 
17 if (xdr args(&xhandle, &out) !- TRUE) 

18 err quit("xdr args error"); 

19 size = xdr getpos (&xhandle); 
20 lptr - (long *) buff; 
21 for (i = 0; i < size; i += 4) 
22 printf ("%ld\n", (long) ntohl(*lptr++)); 
23 exit (0); 
24 } 


sunrpc/xdr l/opt 12.c 








图 16-25 使 三 个 参数 都 不 编码 long 类 型 值 的 程序 

设置 各 个 值 

12—14 ”把 对 应 第 一 个 参数 的 联合 中 的 判别 式 设置 为 FALSE， 把 对 
应 第 二 个 参数 的 可 变 长 度数 组 的 长 度 设置 为 0， 把 对 应 第 三 个 参数 的 指 
针 设 置 为 NULL。 

分 配 适当 对 齐 过 的 缓冲 区 并 编码 

15~19 分 配 一 个 缓冲 区 ， 把 我 们 的 out 结 构 编 码 到 一 个 XDR 内 存 流 
中 。 

输出 XDR 绥 冲 区 

20~22 ”使 用 ntoh] 函 数 〈 网 络 到 主机 长 整数 转换 函数 ) 把 对 应 于 该 
内 存 流 的 缓冲 区 中 的 数据 从 XDR 使 用 的 大 端 字 节 序 转换 成 当前 主机 的 字 
节 序 ， 然 后 每 个 4 字 节 值 一 次 地 输出 。 

该 输出 准确 地 展示 了 由 XDR 运 行 时 系统 编码 到 该 缓冲 区 中 的 数据 。 
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0 

0 

0 

IESU BTN ARE, SEA RUE ALLE AON 4h Fwy, TRAN 
后 面 不 跟 任 何 值 。 





图 16-26 是 对 前 一 个 程序 的 修改 ， 它 给 所 有 三 个 参数 赋值 ， 把 它们 
编码 到 一 个 XDR 内 存 流 中 ， 然 后 输出 这 个 流 。 


sunrpc/xdr l/opt1.c 





1 #include "unpipc.h" 

2 #include "Optl.h" 

3; dnt 

4 main(int argc, char **argv) 

5 

6 int qe 

7 XDR xhandle; 

8 char *buff; 

9 long lval2, lval3, *lptr; 

10 args out; 

11 Size t size; 

12 out.argl.flag - TRUE; 

13 out.argl.optlong u.val - 5; 

14 lval2 = 9876; 

15 out.arg2.arg2 len - 1; 

16 out.arg2.arg2 val - &lval2; 

17 lval3 - 123; 

18 out.arg3 - &lval3; 

19 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
20 xdrmem create(&xhandle, buff, BUFFSIZE, XDR_ENCODE) ; 
21 if (xdr args(&xhandle, &out) !- TRUE) 
22 err quit("xdr args error"); 
23 Size = xdr getpos (&xhandle) ; 
24 lptr - (long *) buff; 
25 for (i = 0; i < size; i += 4) 
26 printf ("%ld\n", (long) ntohl (*lptr++) ) ; 
27 exit (0); 
28 } 


sunrpc/xdr l/optl.c 





图 16-26 给 来 自 图 16-23 的 所 有 三 个 参数 赋值 





设置 各 个 值 

12—18 ”为 给 对 应 第 一 个 参数 的 联合 赋 一 个 值 ， 我 们 把 它 的 判别 式 
设置 成 TRUE， 然 后 设置 它 的 值 。 为 给 对 应 第 二 个 参数 的 可 变 长 度数 据 
赋 一 个 值 ， 我 们 把 它 的 长 度 设置 为 1， 并 把 与 它 关 联 的 指针 设置 成 指向 
它 的 值 。 为 给 对 应 第 三 个 参数 的 指针 赋 一 个 值 ， 我 们 把 它 设 置 成 存放 其 
值 的 变量 的 地 址 。 

运行 这 个 程序 ， 输 出 的 是 预期 的 6 个 4 字 节 值 : 

solaris % opt1 


1 判别 式 值 为 TRUE 


1 可 变 长 度数 组 的 长 度 

1 非 空 指针 变量 的 标志 

5 

9876 

123 

16.8.4 例子 : 链表 处 理 

有 了 前 面 的 例子 所 介绍 的 编码 可 选 数据 的 能 力 后 ， 我 们 就 可 以 对 














XDR 的 指针 表示 进行 扩充 ， 用 它 来 编码 和 解码 含有 可 变数 目 元 素 的 链 


表 。 


我 们 的 例子 是 一 个 名 - 值 对 (Cname-value pair) 链表 ， 图 16-27 给 出 了 


它 的 XDR 说 明 书 文件 。 


sunrpc/xdr I/opt2.x 





Fe 


1 struct mylist { 


2 string name<>; 
3 long value; 
4 mylist *next; 


5}; 


6 struct args { 
7 mylist *list; 


8 ) ? 
sunrpc/xdr l/opt2.x 


图 16-27 名 - 值 对 链表 的 XDR 说 明 书 文件 
1~5 我 们 的 mylist 结 构 含有 一 个 名 - 值 对 和 一 个 指 问 下 一 个 结构 的 指 
该 链表 中 的 最 后 一 个 结构 将 有 一 个 值 为 null 的 next 指 针 。 
图 16-28 给 出 了 由 rpcgen 根 据 图 16-27 产 生 的 .bh 文件 。 


sunrpc/xdr 1/opt2.h 





7 struct mylist { 


8 char *name; 

9 long value; 

10 struct mylist *next; 
11 }; 


12 typedef struct mylist mylist; 


13 struct args { 

14 mylist *list; 

15 }; 

16 typedef struct args args; 

sunrpc/xdr l/opt2.h 





116-28 对 应 于 图 16-27 的 C 声 明 





图 16-29 给 出 的 程序 先 初 始 化 一 个 含有 3 个 名 - 值 对 的 链表 ， 然 后 调用 
XDR 运 行 时 系统 对 它 进行 编码 。 

初始 化 链表 

11—22 分配 4 个 链表 项 的 空间 ， 但 只 初始 化 其 中 3 个 。 第 一 项 为 
nameval[2]， 第 二 项 为 nameval[1]， 第 三 项 为 nameval[0]。 链 表 的 头 
Cout.list) 设置 成 &nameval[2]。 

以 这 样 的 顺序 初始 化 该 链表 是 为 了 展示 XDR 运 行 时 系统 依循 指针 规 
则 ， 而 且 所 编码 的 链表 项 顺序 跟 所 用 的 数组 元 素 没 有 关系 。 我 们 还 把 各 
个 链表 项 的 值 初始 化 成 十 六 进 制 值 ， 因 为 长 整数 值 是 以 十 六 进 制 输出 
的 ， 这 使 得 查看 每 个 字 节 中 的 各 个 ASCII 值 更 为 容易 。 





sunrpc/xdr 1/opt2.c 





1 #include "unpipc.h" 

2 #include "Opt2.H" 

3 int 

4 main(int argc, char **argv) 

B1 

6 int ij 

7 XDR xhandle; 

8 long *lptr; 

9 args out; /* the structure that we fill */ 
10 char *buff; /* the XDR encoded result */ 
TIT mylist  nameval [4]; /* up to 4 list entries */ 
12 size t size; 

13 out.list = &nameval [2]; /* [2] -> [1] -> [0] */ 
14 nameval [2] .name = "namel"; 

15 nameval [2] .value = 0x1111; 

16 nameval [2] .next = &nameval [1]; 

T7 nameval[1].name - "namee2"; 

18 nameval[1].value = 0x2222; 

19 nameval[1].next - &nameval[0]; 

20 nameval[0].name - "nameee3"; 

21 nameval[0].value - 0x3333; 

22 nameval[0].next = NULL; 

23 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
24 xdrmem create(&xhandle, buff, BUFFSIZE, XDR ENCODE); 
25 if (xdr args(&xhandle, &out) !- TRUE) 

26 err quit("xdr args error"); 

27 size = xdr getpos (&xhandle) ; 

28 lptr = (long *) buff; 

29 for (i = 0; i < size; i += 4) 

30 printf ("S8lx\n", (long) ntohl(*lptr++)); 

31 exit (0); 

32; } 


sunrpc/xdr l/opt2.c 





图 16-29 初始 化 一 个 链表 ， 对 它 编码 后 输出 结果 


程序 的 输出 表明 ， 前 三 个 链表 项 之 前 有 一 个 为 1 的 4 字 节 值 〈 我 们 既 
可 以 认为 它 是 一 个 可 变 长 度数 组 值 为 1 的 长 度 ， 也 可 以 认为 它 是 布尔 值 
TRUE) ， 第 四 个 表 项 仅 由 一 个 为 0 的 4 字 节 值 构成 ， 指 示 链 表 的 结尾 。 
solaris % opt2 


1 后 跟 一 个 元 素 








5 字符 串 长 度 
6e616d65 name 


31000000 1，3 个 填充 字 节 


1111 


6e616d65 
65320000 
2222 

1 

7 
6e616d65 
65653300 

3333 

0 


相应 的 值 
jk ER — ^P ICR 
字符 串 长 度 
name 
e 2，2 个 填充 字 节 
相应 的 值 
jk ER — ^P 7638 
字符 串 长 度 
name 
ee3，1 个 填充 字 节 
相应 的 值 
AAG ICR: 链表 尾 


当 XDR 给 这 种 格式 的 链表 解码 时 ， 它 将 给 链表 项 和 指针 动态 分 配 内 
存 空间 ， 并 把 各 个 指针 链接 起 来 ， 以 允许 我 们 在 C 中 方便 地 志 历 整个 链 


表 。 


16.9 RPC 分 组 格式 


图 16-30 展 示 了 封装 在 一 个 TCP 分 节 中 的 一 个 RPC 请 求 的 格式 。 





MN 






unsigned int xid 事务 ID (XID) 
enum msg type 消息 类 型 ( 0= 调 用 ) 


unsegned int rpcvers 


RPC 版 本 (2 ) 
认证 形式 
Lr 
-~ 之 


unsegned int_proc 








enum auth_flavor 


e + A A A A A A R 


rpc_msg{} "n 
cre 


call body() opaque body<400> 
enum auth flavor 认证 形式 4 
验证 器 长 度 4 
verf 
opaque body<400> 
验证 器 数据 最 多 400 字 节 


图 16-30 封装 在 一 个 TCP 分 节 中 的 RPC 请 求 


既然 TCP 是 一 个 字 节 流 ， 不 提供 消 妃 边界 ， 因 此 应 用 程序 必须 提供 
界定 各 个 消息 的 某 种 方法 。Sun RPC 定 义 了 既 可 作为 请 求 也 可 作为 应 答 
的 记录 (record) ， 每 个 记录 由 一 个 或 多 个 片段 (fragment) 构成 。 每 个 
片段 以 一 个 4 字 节 值 开 头 : 其 中 最 局 位 是 最 终 片 段 的 标志 ， 低 序 31 位 是 











计数 。 如 果 最 终 片 段 标志 位 为 0， 那 么 构成 当前 记录 的 还 有 别 的 片段 。 

这 个 4 字 节 值 跟 所 有 的 4 字 节 XDR 整 数 一 样 ， 是 以 大 端 字 节 序 传 送 
的 ， 但 是 本 字段 却 不 在 标准 的 XDR 格 式 中 ， 因 为 XDR 并 不 传送 位 字 
Bes 

如 果 所 用 的 是 UDP 而 不 是 TCP， 那 么 紧 跟 在 UDP 首部 之 后 的 第 一 个 
字段 是 XID， 如 图 16-32 所 示 。 

使 用 TCP 时 ，RPC 请 求 和 应 答 的 大 小 几乎 不 存在 限制 ， 因 为 可 使 用 
任意 数目 的 片段 ， 而 每 个 片段 又 有 一 个 31 位 的 长 度 字 段 。 然 而 使 用 UDP 
时 ， 请 求 和 应 答 都 必须 适合 单个 UDP 数据 报 ， 而 一 个 数据 报 能 容纳 的 最 
大 数据 量 是 65507 字 节 【〈 假 设 网 络 协 议 为 IJPv4) 。 先 于 TI-RPC 软 件 包 的 
许多 实现 还 把 请 求 或 应 答 的 大 小 进一步 限制 到 8192 字 节 左 右 ， 因 此 如 果 
请 求 或 应 答 需 要 多 于 约 8000 字 节 的 话 ， 那 就 得 改 用 TCP。 

我 们 现在 给 出 取 自 RFC 1831 的 一 个 RPC 请 求 的 真正 XDR 说 明 书 。 图 
16-30 中 给 出 的 名 字 就 出 自 该 说 明 书 。 

enum auth_flavor { 

AUTH_NONE = 0; 
AUTH_SYS = 1; 
AUTH_SHORT = 2 


/* and more to be defined */ 














nh 
struct opaque auth { 
auth flavor flavor; 
opaque body<400>; 
ph 
enum msg type 1 
CALL = 0; 
RELAY -1 


H 
struct call body 1 


unsigned intrpcvers; /* RPC version: must be 2 */ 
unsigned intprog; /* program number */ 
unsigned intvers; /* version number */ 
unsigned intproc; /* procedure number */ 
opaque auth cred; /* caller's credentials */ 
opaque auth verf; /* caller's verifier */ 


/* procedure-specific parameters start here */ 
le 
struct rpc msg { 
unsigned int xid; 
union switch (msg type mtype){ 
case CALL: 
call. body cbody; 
case REPLY: 
reply. body rbody; 
} body; 
js 
含有 凭证 和 验证 器 的 可 变 长 度 不 透明 数据 的 内 容 取 雇 于 认证 形式 。 
对 于 空 认 证 (默认 形式 ) 来 说 ， 该 不 透明 数据 的 长 度 应 为 0。 对 于 Unix 
认证 来 说 ， 该 不 透明 数据 含有 如 下 信息 : 
struct authsys_parms { 
unsigned int stamp; 
string machinename<255>; 
unsigned int uid; 


unsigned int gid; 


unsigned int gids<16>; 
h 
当 赁 证 的 认证 形式 为 AUTH_SYS 时 ， 验 证 器 的 认证 形式 应 为 
AUTH_NONE. 
RPC 应 答 的 格式 比 请 求 的 格式 复杂 ， 因 为 请 求 中 可 能 发 生 错误 。 图 
16-31 展 示 了 RPC 应 答 的 各 种 可 能 。 


人 


MSG ACCEPTED MSG DENIED 
SUCCESS PROG UNAVAIL RPC MISMATCH AUTH ERROR 


PROG MISMATCH 
PROC UNAVAIL 

GARBAGE ARGS 

SYSTEM ERR 


图 16-31 可 能 的 RPC 应 答 
图 16-32 展 示 了 一 个 成 功 的 RPC 应 答 的 格式 ， 不 过 这 一 次 封装 在 一 
个 UDP 数据 报 中 。 


20 字 节 





unsigned int xid 

enum msg type 
enum reply stat 
enum auth flavor 
rpc msg() 


reply body(] verf 


opaque body<400> 


accepted reply() 


接受 状态 ( 0= 成 功 ) 


enum accept_stat 


过 程 结 果 





图 16-32 封装 为 一 个 UDP 数据 报 的 成 功 的 RPC 应 答 
我 们 现在 给 出 取 自 RFC 1831 的 一 个 RPC 应 答 的 真正 XDR 说 明 书 。 
enum reply stat { 
MSG ACCEPTED = 0; 
MSG. DENIED = 0 
is 
enum accept. stat { 
SUCCESS = 0, /* RPC executed successfully */ 
PROG UNAVAIL =1, /* program £ unavailable */ 
PROG MISMATCH = 2, /* version # unavailable */ 
PROC UNAVAIL 2-73, /* procedure £ unavailable */ 
GARBAGE ARGS =4, /* cannot decode arguments */ 
SYSTEM ERR ..5  /J/.memor.allocatio.failure,etc.*/ 


struct accepted_reply { 
opaque_auth verf; 
union switch (accept. stat stat) { 
case SUCCESS: 


opaque results[O ; /* procedure-specific results start here */ 
case PROG MISMATCH: 
struct 1 


unsigned int low;  /* lowest version # supported */ 
unsigned int high; /* highest version £ supported */ 


) mismatch info; 


default: p* 
PROG UNAVAIL,PROC UNAVAIL,GARBAGE ARGS, SYSTEM ERE 
y. 

void; 


} reply_data; 
js 
union reply. body switch (reply. stat stat){ 
case MSG ACCEPTED: 
accepted reply areply; 
case MSG DENIED: 
rejected reply rreply; 
} reply; 
如 采 RPC 版 本 号 有 误 ， 或 者 发 生 认 证 错误 ， 服 务 器 就 可 能 拒绝 调用 
请 求 。 
enum reject_stat { 
RPC_MISMATCH = 0, /* RPC version number not 2 */ 
AUTH_ERROR =1 /* authentication error */ 


F 


enum auth_stat { 


AUTH_OK —0, /* success */ 

/* following are failures at server end */ 
AUTH_BADCRED =1, /* bad credential (seal broken)*/ 
AUTH_REJECTEDCRED = 2, /* client must begin new session */ 
AUTH_BADVERF = 3, /* bad verifier (seal broken)*/ 
AUTH REJECTEDVERF = 4， /* verifier expired or replayed */ 
AUTH_TOOWEAK =5, /# rejected for security reasons */ 


/* following are failures at client end */ 
AUTH INVALIDRESP =6, /* bogus response verifier */ 
AUTH FAILED =7 /* reason unknown */ 
ie 
union rejected_reply switch (reject stat stat)1 
case RPC MISMATCH: 
struct 1 
unsigned int low; /* lowest RPC version # supported */ 
unsigned int high; /* highest RPC version # supported */ 
) mismatch info; 
case AUTH. ERROR: 


auth stat stat; 


16.10 小 结 


Sun ”RPC 人 允许 我 们 编写 分 布 式 应 用 程序 ， 让 客户 运行 在 一 台 主 机 
上 ， 服 务 句 运行 在 妨 一 台 主 机 上 。 我 们 首先 定义 了 客户 能 够 调用 的 服务 


器 过 程 ， 然 后 编写 了 一 个 描述 这 些 过 程 的 参数 和 返回 值 的 RPC 说 明 书 文 
件 。 我 们 接着 编号 了 调用 服务 器 过 程 的 客户 程序 main 函 数 以 及 服务 器 过 
程 本 身 。 客 户 程序 的 代码 看 起 来 只 是 简单 地 调用 服务 器 过 程 ， 但 在 其 背 
后 ， 各 种 各 样 的 RPC 运 行 时 例 程 隐藏 了 网 络 通信 正在 发 生 的 事实 。 

rpcgen 程 序 是 构建 使 用 RPC 的 应 用 程序 的 一 个 基本 工具 。 它 读 入 我 
们 的 说 明 书 文件 ， 产 生 客 户 程 序 存 根 和 服务 器 程序 存根 ， 同 时 产生 调用 
所 需 XDR 运 行 时 例 程 以 处 理 所 有 数据 转换 的 函数 。XDR 运 行 时 系统 也 
是 构建 使 用 RPC 的 应 用 程序 过 程 中 的 一 个 基本 部 件 。XDR 定 义 了 在 不 同 
的 系统 间 交 换 各 种 数据 格式 的 一 种 标准 方法 ， 这 些 系统 可 能 具有 不 同 的 
整数 大 小 、 不 同 的 字 节 序 、 不 同 的 浮 点 数 格式 等 。 正 如 我 们 所 示 的 那 
样 ，XDR 可 独立 于 RPC 软 件 包 单 独 使 用 ， 其 目的 纯粹 是 为 了 以 一 种 标准 
的 格式 交换 数据 ， 而 数据 的 交换 可 以 使 用 任意 形式 的 真正 传送 数据 的 通 
信 手 段 〈 例 如 使 用 套 接 字 或 XITI 编 写 的 程序 、 软 盘 、CD-ROM 等 ) 。 

Sun RPC 提 供 了 自己 的 命名 形式 ， 这 种 命名 使 用 32 位 程序 号 、32 位 
版 本 号 和 32 位 过 程 号 。 运 行 一 个 RPC 服 务 器 的 每 台 主 机 必须 运行 一 个 名 
为 端口 映射 器 〈 现 在 称 为 RPCBIND) 的 程序 。RPC 服 务 器 捆绑 临时 的 
TCP 和 UDP 端口 后 同 问 口 映 射 器 注册 ， 从 而 把 这 些 临 时 端口 与 由 服务 器 
提供 的 程序 号 和 版 本 号 关联 起 来 。 当 一 个 RPC 客 户 启 动 时 ， 它 首先 跟 服 
务 器 主机 上 的 端口 映射 器 联系 以 获取 所 需 的 端口 号 ， 然 后 跟 服 务 器 本 身 
联系 ， 通 常情 况 下 要 么 使 用 TCP， 要 么 使 用 UDP。 

默认 情况 下 ，RPC 和 客户 不 提供 任何 认证 信息 ，RPC 服 务 器 则 处 理 所 
收 到 的 任何 客户 请 求 。 这 跟 我 们 使 用 套 接 字 或 XTI 编 写 自己 的 客户 -服务 
器 程序 一 样 。Sun RPC 提 供 了 另外 三 种 认证 形式 Unix 认 证 (提供 客户 
的 主机 名 、 用 户 ID 和 组 ID) 、DES 认 证 《基于 私 铀 和 公 钥 加 密 技术 ) 和 
Kerberos 认 证 。 

理解 作为 底层 支撑 的 RPC 软 件 包 中 的 超时 和 重 传 策略 对 于 使 用 
RPC (或 进行 任何 形式 的 网 络 编程 》 至 关 重 要 。 当 使 用 诸如 TCP 这 样 的 
































可 靠 传输 层 时 ，RPC 客 户 只 需要 一 个 总 超时 ， 因 为 任何 丢失 或 重复 的 分 
组 都 是 由 传输 层 完 全 处 理 的 。 然 而 当 使 用 诸如 UDP 这 样 的 不 可 靠 传输 层 
时 ， 除 总 超时 外 ，RPC 软 件 包 还 有 一 个 重 试 超 时 。RPC 客 户 使 用 事务 ID 
来 验证 某 个 接收 到 的 应 答 是 所 期 望 的 应 答 。 

任何 过 程 调用 可 划 归 为 具有 正好 一 次 语义 、 最 多 一 次 语义 或 最 少 一 
次 语义 。 对 于 本 地 过 程 调 用 ， 我 们 通常 忽略 这 些 问题 ， 但 是 对 于 RPC， 
我 们 必须 清楚 这 几 种 语义 的 差异 ， 并 理解 等 势 过 程 (能够 不 出 问题 地 调 
用 任意 多 次 的 过 程 ) 和 非 等 势 过 程 〈 必 须 只 调用 一 次 的 过 程 ) ZA AE 
别 。 

Sun RPC 是 一 个 庞大 的 软件 包 ， 而 我 们 只 是 触及 了 它 的 皮毛 而 已 。 
不 过 有 了 本 章 中 讨论 的 基本 知识 后 ， 就 能 编写 出 完整 的 应 用 程序 。 
rpcgen 的 使 用 隐藏 了 许多 细节 ， 并 简化 了 代码 编写 工作 。Sun 的 手册 中 
把 使 用 RPC 的 代码 编写 工作 划分 成 多 个 级 别 一 一 简化 的 接口 、 顶 级 、 中 
间 级 、 专 家 级 和 底 级 ， 不 过 这 样 的 划分 毫 无 意义 。RPC 运 行 时 系统 总 共 
提供 164 个 函数 ， 划 分 成 以 下 六 类 : 

11 个 auth_ 函 数 〈 认 证 ) ; 

26 个 clnt_ 函数 〈 客 户 方 ) ; 

5 个 pmap_ 函 数 〈( 端 口 映 射 嚣 访问 ); 

24^ rpc 函数 〈 一 般 性 ) ; 

44^ svc_pPei a CARS 287] ; 

54^ xdri Zt C(XDR 转 换 ) 。 

比较 一 下 ， 套 接 字 API 和 XTI API 分 别 有 约 25 个 函数 ， 门 API、Posix 
和 System V 各 自 的 消息 队列 API、 信 号 量 API 和 共享 内 存 区 API 分 别 有 少 
于 10 个 的 函数 。 处 理 Posix 线 程 的 函数 有 15 个 ， 处 理 Posix 条 件 变量 的 函 
数 有 10 个 ， 处 理 Posix 读 写 锁 的 函数 有 11 个 ， 处 理 fcnt 记 录 上 锁 的 函数 只 
有 1 个 。 











习题 


16.1 当 启 动 某 个 RPC 服 务 器 时 ， 它 向 端口 映射 器 注册 其 自身 。 如 果 
终止 该 服务 器 〈 璧 如 说 使 用 终端 中 断 键 》， 那 么 它 的 注册 会 有 什么 变 
化 ?如 果 发 往 该 服务 器 的 某 个 客户 请 求 在 此 后 某 个 时 刻 到 达 ， 那 会 发 生 
什么 ? 

16.2 ”假设 有 一 个 基于 UDP 使 用 RPC 的 客户 -服务 器 系统 ， 它 没有 服 
务 器 应 答 高 速 缓存 。 客 户 发 送 一 个 请 求 给 服务 器 ， 但 是 服务 器 将 其 应 答 
发 回 要 花 20 秒 。 客 户 在 15 秒 后 超时 ， 导 致 服务 器 过 程 被 再 次 调用 。 

该 服务 器 的 第 二 个 应 答 将 发 生 什 么 ? 

16.3 XDR 的 string 数 据 类 型 总 是 编码 成 在 一 个 长 度 之 后 跟 以 其 各 个 
字符 。 如 果 我 们 想 要 定 长 的 字符 串 ， 壁 如 说 以 char c[10]f& #string 
s<10>， 那 么 需 做 哪些 变动 ? 

16.4 ”把 图 16-16 中 string 的 最 大 大 小 由 128 改 为 10， 然 后 运行 write 程 
序 ， 发 生 了 什么 ? 现在 把 最 大 长 度 指定 符 从 string 声 明 中 去 掉 ， 也 就 是 
说 写成 string ”vstring_arg<>， 比 较 修改 前 后 分 别 产 生 的 data_xdr.c 文 件 ， 
有 什么 变化 ? 

16.5 ”把 图 16-18 中 xdrmem_create 的 第 三 个 参数 (缓冲 区 大 小 ) BA 
50， 看 发 生 了 什么 。 

16.6 在 16.5 节 中 我 们 讲述 了 当 使 用 UDP 时 可 被 局 用 的 重复 请 求 高 速 
缓存 。 我 们 可 以 说 TCP 维 护 着 自己 的 重复 请 求 高 速 绥 存 。 这 具体 指 什 
么 ， 另 外 这 个 TCP 重 复 请 求 高 速 缓存 有 多 大 ? Gas: TCP 是 如 何 检测 
收 到 重复 数据 的 ? ) 

16.7 ”给 定 唯一 标识 服务 器 重复 请 求 高 速 缓存 中 每 一 项 的 那 5 个 元 
素 ， 当 比较 某 个 新 的 请 求 和 高 速 缓存 中 各 个 项 时 ， 这 5 个 值 以 怎样 的 顺 
序 进行 比较 所 需 比 较 次 数 最 少 ? 

16.8 观察 16.5 节 中 使 用 TCP 的 客户 -服务 器 系统 的 真正 分 组 传递 ， 可 






































看 到 请 求 分 节 的 大 小 为 48 字 节 ， 应 答 分 节 的 大 小 为 32 字 节 【〈 忽 略 IPv4 首 
部 和 TCP 首 部 ) 。 分 析 这 两 个 大 小 《例如 如 图 16-30 和 图 16-32 那 样 ) 。 

如 果 改 用 UDP 代替 TCP， 那 么 这 两 个 大 小 是 多 少 ? 

16.9 在 不 支持 线程 的 系统 上 的 RPC 客 户 能 调用 编译 成 支持 线程 的 服 
务 器 过 程 吗 ? 我 们 在 16.2 节 中 叙述 的 调用 参数 上 的 差异 情况 怎么 样 ? 

16.10 ”在 图 16-19 的 read 程 序 中 ， 我 们 分 配 读 入 文件 用 的 缓冲 区 空 
间 ， 而 该 缓冲 区 中 含有 指针 vstring_arg。 请 问 由 vstring_arg 所 指 的 字符 串 
存放 在 哪儿 ? 修改 该 程序 以 验证 你 的 假设 。 

16.11 Sun RPC 把 空 过 程 (null procedure) 定义 为 过 程 号 为 0 的 过 程 

(这 就 是 我 们 总 是 以 1 开始 过 程 编号 的 原因 ， 如 图 16-1 所 示 〉。 男 外 ， 
由 rpcgen 生 成 的 每 个 服务 器 存根 自动 定义 该 过 程 ( 这 一 点 只 需 查 看 由 本 
章 中 的 例子 生成 的 任何 服务 器 存根 就 能 轻而易举 地 验证 ) 。 空 过 程 不 需 
要 参数 ， 也 不 返回 东西 ， 往 往 用 于 验证 给 定 服 务 器 正在 运行 ， 或 者 测量 
到 服务 器 的 往返 时 间 。 然 而 要 是 我 们 查看 客户 存根 ， 

那么 会 发 现 rpcgen 并 没有 给 空 过 程 产 生存 根 。 查 看 clnt_call 函 数 的 手 
册页 面 ， 并 用 它 来 对 本 章 中 给 出 的 任意 一 个 服务 器 调用 空 过 程 。 

16.12 图 A-2 中 对 于 使 用 UDP 的 Sun RPC 来 说 ， 为 什么 不 存在 消息 大 
小 为 65536 的 项 ? 图 A-4 中 对 于 使 用 UDP 的 Sun RPC 来 说 ， 为 什么 不 存在 
消息 大 小 为 16384 和 32768 的 项 ? 

16.13 验证 在 图 16-19 中 省 略 xdr_free 调 用 将 引入 内 存 空间 泄漏 

(memory leak) 。 在 调用 xdrmem_create 的 紧 前 插入 以 下 语句 : 

for ( ; ; ){ 

再 把 配对 的 右 花 括 弧 放 在 调用 xdr_free 的 紧 前 。 运 行 该 程序 ， 使 用 
ps 观察 它 的 内 存 空间 大 小 。 然 后 把 配对 的 右 花 括 弧 改 放 到 调用 xdr_free 
之 后 ， 再 运行 该 程序 ， 观 察 它 的 内 存 空间 大 小 。 





























[1]. Linux 上 门 接口 实现 的 URL 已 挪 到 了 http://www.rampant.org/doors/ 


中 。 


[2]. SUID 是 可 执行 文件 的 一 个 权限 位 。 设 置 了 该 位 的 可 执行 文件 运行 
时 ， 相 应 进程 的 有 效用 户 ID 就 设置 成 该 文件 的 属 主 ( 本 例子 中 就 是 
root) ， 从 而 可 达到 获取 原本 没有 的 特权 之 目的 。 典 型 的 SUID 程 序 是 修 
改口 令 用 的 passwd (路 径 名 通常 为 /bin/passwd 或 /usr/bin/passwd， 注 意 
与 /etc/passwd 区 分 开 ) ， 该 文件 的 属 主 为 root。 当 普通 用 户 执 行 passwd 
程序 时 ， 实 际 上 和 暂时 取得 了 超级 用 户 的 特权 ， 能 够 修改 原本 只 能 读 

的 /etc/passwd 文 件 ， 不 过 程序 代码 控制 着 具体 的 操作 ， 使 得 有 恶意 的 用 
户 不 能 胡作非为 。 FAI 


[3]. 此 处 为 UNPv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 15.7 节 。 一 编者 注 


[4]. 这 里 涉及 有 关 线 程 的 不 少 概念 。 首 先 ， 我 们 必须 区 分 并 发 
(concurrency) 和 并 行 (parallelism) 。 一 个 多 处 理 机 应 用 程序 运行 时 
的 并 行 度 是 实际 达到 的 并 行 执 行程 度 ， 因 此 受 限 于 其 进程 可 用 的 物理 处 
理 器 数 。 该 应 用 程序 的 并 发 度 则 是 在 处 理 右 数 无 限 的 理想 前 提 下 所 能 i 
到 的 最 大 并 行 度 。 其 次 ， 并 发 既 可 在 系统 级 提供 ， 也 可 在 用 户 级 提供 。 
内 核 通过 认 知 一 个 进程 内 的 多 个 线程 〈 也 称 为 热线 程 ) 并 独立 地 调度 它 
们 来 提供 系统 级 并 发 。 内 核 然 后 把 这 些 线程 复 用 到 可 用 的 处 理 器 上 。 用 
户 级 并 发 则 由 应 用 程序 通过 用 户 级 线程 库 提 供 。 内 核 不 认得 这 样 的 用 户 
线程 〈 也 称 为 冷 线 程 ) ， 因 而 必须 由 用 户 级 线程 库 管 理 和 调度 。 许 多 系 
统 ( 包 括 提供 门 API 的 Solaris 2.6) 实现 了 把 两 者 结合 起 来 的 双 并 发 模 
型 : 内核 认得 一 个 进程 内 的 多 个 线程 ， 线 程 库 则 支持 不 为 内 核 所 见 的 用 
户 线程 。 再 次 ，Solaris 2.x 文 持 内 核 线程 〈kernelthread) 、 轻 权 进 程 
(lightweight process) 和 用 户 线程 (userthread) 。 内 核 线程 是 能 够 被 独 
立地 调度 和 派 遗 到 某 个 系统 处 理 器 上 运行 的 基本 轻 权 对 象 。 它 不 必 与 一 
个 用 户 进程 相关 联 ， 是 由 内 核 根据 内 部 需要 创建 、 运 行 或 毁 除 以 执行 指 
定 的 功能 的 。 内 核 线程 对 于 应 用 程序 不 可 见 。 轻 权 进 程 是 内 核 支 持 的 用 
户 可 见 线程 ， 属 于 热线 程 。 它 其 于 内 核 线 程 ， 实 际 上 每 个 轻 权 进程 绑 定 
在 各 目的 内 核 线 程 上 。 用 户 线程 是 由 线程 库 实现 的 内 核 不 可 见 的 更 高 级 
对 象 ， 属 于 冷 线程 。 这 是 用 户 直 接 看 到 的 线程 。 最 后 ， 一 个 进程 内 有 两 
类 用 户 线程 ， 一 类 是 绑 定 在 某 个 轻 权 进程 上 的 线程 ， 一 类 是 共享 公共 的 
轻 权 进程 池 的 未 绑 定 线程 。 竞 用 范围 为 PTHREAD_SCOPE_SYSTEM 的 
线程 属于 绑 定 的 线程 ， 为 PTHREAD_SCOPE_PROCESS 的 线程 属于 未 绑 
定 的 线程 。 一 一 译 者 注 


[5]. 此 处 为 UNPv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 12.4 节 。 一 mA IE 























[6]. 此 处 为 UNPv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 13.5 节 。 一 mare 
[7]. 此 处 为 UNPv1 第 2 版 英文 原版 书 图 号 ， 第 3 版 为 图 13-7。 一 一 编者 注 


[8]. 此 处 为 UNPv1 第 2 版 英文 原版 书页 码 ， 第 3 版 为 第 77 一 80 页 和 第 147 一 
150 页 o 一 ”编者 注 


[9]. 此 处 为 UNPV1 第 2 版 英文 原版 书页 码 ， 第 3 版 为 第 28 一 29 页 。 一 一 编 
者 注 
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本 书 详细 讲述 了 用 于 进程 间 通 信 CPC) 的 四 种 不 同 技术 : 

(1) 消 息 传递 (管道 、FIFO、Posix 和 System V 消 息 队 列 ) ; 

(2) 同 步 〈 互 斥 锁 、 条 件 变量 、 读 写 锁 、 文 件 和 记录 锁 、Posixz 和 
System V 信 号 量 ) 

(3)3 共享 内 存 区 (匿名 共享 内 存 区 、 有 名 Posix 共 享 内 存 区 、 有 名 
System V 共 享 内 存 区 ) ; 

(4) 过 程 调用 (Solaris! J. Sun RPC) 。 

消息 队列 和 过 程 调用 往往 单独 使 用 ， 也 就 是 说 它们 通 第 提供 了 上 自己 
的 同步 机 制 。 相 反 ， 共 享 内 存 区 通常 需要 某 种 由 应 用 程序 提供 的 同步 形 
式 才 能 正确 工作 。 同 步 技术 有 时 候 单 独 使 用 ， 也 就 是 说 不 涉及 其 他 形式 
的 IPC。 

讨论 了 共 16 章 的 细节 后 ， 很 显然 的 一 个 问题 是 : 解决 某 个 特定 问题 
应 使 用 哪 种 形式 的 IPC? 遗憾 的 是 不 存在 关于 IPC 的 简单 判定 。Unix 提 供 
的 类 型 如 此 之 多 的 IPC 表 明 ， 不 存在 解决 全 部 (或 者 甚至 于 大 部 分 ) 问 
题 的 单一 办 法 。 你 能 做 的 仅仅 是 : 逐渐 熟悉 各 种 IPC 形 式 提供 的 机 制 |， 
然后 根据 特定 应 用 的 要 求 比 较 它 们 的 特性 。 

我 们 首先 列 出 必须 考虑 的 四 个 前 提 ， 因 为 它们 对 于 你 的 应 用 程序 相 

(VÆRI (networked) 还 是 非 连 网 的 Cnonnetworked) 。 我 们 假设 
己 作 出 这 个 决定 ，IPC 就 是 用 于 单 台 主机 上 的 进程 或 线程 间 的 。 如 果 应 
用 程序 有 可 能 散布 到 多 台 主 机 上 ， 那 就 考虑 使 用 套 接 字 人 代替 IPC， 从 而 














简化 以 后 向 连 网 的 应 用 程序 转移 的 工作 。 

(2) 可 移植 性 〈portability) 。 回 想 图 1-5， 几 乎 所 有 Unix 系 统 都 支持 
Posix 管 道 、Posix FIFO 和 Posix 记 录 上 锁 。 到 了 1998 年 ， 大 多 数 Unix 系 统 
文 持 System V PC 消息、 信号 量 和 共享 内 存 区 ) ， 而 文 持 Posix 
IPC 消息、 信号 量 和 共享 内 存 区 〉 的 仅 有 几 个 系统 。Posix 了 PC 应 该 出 
现 更 多 实现 ， 然 而 (遗憾 的 是 ) 它 在 Unix ”98 中 只 是 个 选项 。 许 多 Unix 
系统 支持 Posix 线 程 〈 包 括 互 斥 锁 和 条 件 变量 在 内 ) ， 或 者 应 在 不 久 的 
将 来 文 持 它 们 。 有 些 文 持 Posix 线 程 的 系统 不 文 持 互 斥 锁 和 条 件 变量 的 
进程 间 共 享 属性 。Unix 98 需要 的 读 写 锁 应 被 Posix 所 采纳 ， 而 且 许 多 版 
本 的 Unix 已 在 文 持 某 种 类 型 的 读 写 锁 。 内 存 映 射 TO 得 到 广泛 文 持 ， 大 
多 数 Unix 系 统 还 提供 匿名 内 存 映射 (或 者 使 用 /dev/zero， 或 者 使 用 
MAP. ANON) 。 几 乎 所 有 Unix 系 统 都 可 使 用 Sun RPC， 门 则 是 Solaris 特 
有 的 特性 (到 目前 为 止 是 这 样 )。 

(3) 性 能 (performance) 。 如 果 性 能 是 应 用 程序 设计 中 的 一 个 关键 
前 提 ， 那 就 在 你 自己 的 系统 上 运行 附录 人 A 中 开发 的 程序 。 更 好 的 做 法 
是 ， 把 这 些 程序 修改 成 模拟 特定 应 用 的 实际 环境 ， 再 在 这 样 的 环境 中 测 
量 它们 的 性 能 。 

(4) 实 时 调度 Crealtime scheduling) 。 如 果 你 的 应 用 需要 这 一 特性 ， 
而 且 你 的 系统 支持 Posix 实 时 调度 选项 ， 那 就 考虑 使 用 Posix 的 消息 传递 
和 同步 函数 《消息 队 列 、 信 和 号 量 、 互 斥 锁 、 条 件 变 量 ) 。 举 例 来 说 ， 当 
某 个 线程 挂 出 一 个 有 多 个 线程 阻塞 在 其 上 的 信号 量 时 ， 待 解 阻 寨 的 线程 
是 以 一 种 适合 于 所 阻塞 线程 的 调度 策略 和 参数 的 方式 选择 的 。 相 反 ， 
System V 信 和 号 量 不 能 保证 实时 调度 。 

为 帮助 理解 各 种 类 型 IPC 的 一 些 特性 和 局 限 ， 我 们 汇总 了 它们 的 一 
些 主要 差异 。 

管道 和 FIFO 是 字 市 流 ， 没 有 消息 边界 。Posix 消 息 和 System VIALE 
则 有 从 发 送 者 同 接 收 者 维护 的 记录 边界 。 《考虑 到 UNPv1 中 讲述 的 网 际 





协议 族 ，TCP 是 没有 记录 边界 的 字 节 流 ， UDP 则 提供 具有 记录 边界 的 消 
E.) 

当 有 一 个 消息 放置 到 一 个 空 队列 中 时 ，Posix 消 息 队 列 可 向 一 个 进 
程 发 送 一 个 信号 ， 或 者 启动 一 个 新 的 线程 。System V 消 息 队 列 不 提供 类 
似 的 通知 形式 。 这 两 种 消息 队列 都 不 能 直接 跟 select 或 poll (UNPv1 的 第 
6 章 ) 一 起 使 用 ， 不 过 我 们 分 别 在 图 5-14 和 6.9 节 中 提供 了 间接 的 方法 。 

管道 或 FIFO 中 的 数据 字 节 是 先进 先 出 的 。Posix 消 息 和 System  ViH 

有 具备 由 发 送 者 赋予 的 优先 级 。 从 一 个 Posix 消 息 队 列 读 出 消息 时 ， 首 
先 返回 的 总 是 具有 最 高 优先 级 的 消息 。 从 一 个 System V 消 息 队 列 读 出 
时 ， 读 出 者 可 以 请 求 所 想 要 的 任意 优先 级 的 消息 。 

当 有 一 个 消息 放置 到 一 个 Posix 或 System V 消 息 队 列 ， 或 者 写 到 一 个 
管道 或 FIFO 时 ， 只 有 一 个 副本 递交 给 刚好 一 个 线程 。 这 些 IPC 形 式 不 存 
在 密探 能 力 〈 即 类 似 于 套 接 字 API 的 MSG_PEEK 标 志 ，UNPv1 的 13.7 节 
[1] 〉， 它 们 的 消息 也 不 能 广播 或 多 播 到 多 个 接收 者 (这 对 于 使 用 UDP 
协议 的 套 接 字 程序 和 XTI 程 序 是 可 能 的 ，UNPv1 第 18 章 和 第 19 章 ) 。 

互 斥 锁 、 条 件 变量 和 读 写 锁 都 是 无 名 的 ， 也 就 是 说 它们 是 基于 内 存 
的 。 它 们 能 够 很 容易 地 在 单个 进程 内 的 不 同 线程 间 共 享 。 然 而 只 有 当 它 
们 存放 在 不 同 进程 间 共 享 的 内 存 区 中 时 ， 它 们 才 可 能 为 这 些 进程 所 共 
享 。 而 Posix 信 和 号 量 就 有 两 种 形式 : 有 名 的 和 基于 内 存 的 。 有 名 信号 量 
总 能 在 不 同 进程 间 共 享 〈 因 为 它们 是 用 Posix IPC 名 字 标 识 的 ) ， 基 于 内 
存 的 信和 号 量 也 能 在 不 同 进程 间 共 享 ， 条 件 是 必须 存放 在 这 些 进程 间 共 享 
的 内 存 区 中 。System V 信 号 量 也 是 有 名 的 ， 不 过 所 用 的 是 key_t 数 据 类 
型 ， 它 往往 是 从 某 个 文件 的 路 径 名 获取 的 。 这 些 信 号 量 能 够 很 容易 地 在 
不 同 进程 间 共 享 。 

如 果 持 有 某 个 锁 的 进程 没有 释放 它 就 终止 ， 内 核 就 自动 释放 fcntl 记 
录 锁 。System V 信 号 量 将 这 一 特性 作为 一 个 选项 提供 。 互 斥 锁 、 条 件 变 
量 、 读 写 锁 和 Posix 信 和 号 量 不 具备 该 特性 。 
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每 个 fcntl 锁 都 与 通过 其 相应 描述 符 访 问 的 文件 中 的 某 个 字 节 范 
(我 们 称 之 为 一 个 “记录 ”) 相关 联 。 读 写 锁 则 不 与 任何 类 型 的 记录 关 
联 。 

Posix 共 享 内 存 区 和 System V 共 享 内 存 区 都 具有 随 内 核 的 持续 性 。 它 
们 一 直 存 在 到 被 显 式 地 删除 为 止 ， 即 使 当前 没有 任何 进程 在 使 用 它们 也 
这 样 。 

Posix 共 享 内 存 区 对 象 的 大 小 可 在 其 使 用 期 间 扩 张 。System V 共 享 内 
存 区 的 大 小 则 是 在 创建 时 固定 下 来 的 。 

System V IPC 所 存在 的 三 种 内 核 限 制 往往 需要 系统 管理 员 对 它们 进 
行 调整 ， 因 为 它们 的 默认 值 通常 不 能 满足 现实 应 用 的 需要 (3.8 节 ) 。 
Posix IPC 所 存在 的 三 种 内 核 限制 则 通常 根本 不 需要 调整 。 

有 关 System V IPC 对 象 的 信息 (当前 大 小 、 属 主 ID、 最 后 修改 时 
间 ， 等 等 ) 可 使 用 三 个 XXXctl 函 数 的 IPC_STAT 命 令 获 取 ， 也 可 执行 
ipcs 命 令 获 取 。 有 关 Posix IPC 对 象 的 信息 则 不 存在 标准 的 获取 方式 。 如 
果 这 些 对 象 是 用 文件 系统 中 的 文件 实现 的 ， 而 且 我 们 知道 从 Posix IPC 名 
字 到 路 径 名 的 映射 关系 ， 那 么 这 些 对 象 的 信息 可 使 用 stat 函 数 或 1s 命 令 
获取 。 但 是 如 果 这 些 对 象 不 是 使 用 文件 实现 的 ， 那 么 可 能 获取 不 了 这 样 
的 信息 。 

在 众多 的 同步 技术 一 一 互 斥 锁 、 条 件 变量 、 读 写 锁 、 记 录 锁 、 
Posix 信 号 量 和 System V 信 号 量 一 一 中 ， 可 从 信号 处 理 程序 中 调用 的 函数 
(图 5-10) 只 有 sem_post 和 fcntl。 

在 众多 的 消息 传递 技术 一 一 管道 、FIFO、Posix 消 息 队 列 和 System 
V 消 息 队 列 一 一 中 ， 可 从 一 个 信号 处 理 程序 中 调用 的 函数 只 有 read 和 
write 〈 适 用 于 管道 和 FIFO) 。 

在 所 有 的 消息 传递 技术 中 ， 只 有 门 向 服务 器 准确 地 提供 了 客户 的 标 
识 〈15.5 节 ) 。 在 5.4 节 中 我 们 提 到 过 ， 另 外 两 种 消息 传递 类 型 也 标识 客 
P: BSD/OS 在 使 用 Unix 域 套 接 字 时 提供 这 种 标识 CUNPv1 的 14.8 节 [2] 











) ，SVR4 则 在 通过 某 个 管道 传递 一 个 描述 符 时 通过 同一 个 管道 传递 发 
送 者 的 标识 (APUE 的 15.3.1 节 ) 。 
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[1]. 此 处 为 UNPv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 14.3 节 。 一 一 编者 注 
[2]. 此 处 为 UNPv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 15.2 节 。 一 编者 注 








助 于 我 们 束 何 时 该 使 用 茶 种 特定 形式 的 IPC 做 出 明智 的 决 集 


值 ， 我 们 从 一 个 进程 向 力 一 Honc esM CLE AST) « 
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A.1 概述 

本 书 讨论 了 六 种 类 型 的 消息 传递 : 
= 管道 ; 

FIFO; 

PosixiH BAA; 
System V 消 县 队列 ; 
门 ; 

Sun RPC. 

和 五 种 类 型 的 同步 : 
互 斥 锁 和 条 件 变量 ; 
读 写 锁 ; 
fcntl 记 录 上 锁 ; 
Posix 信 号 量 ; 


System V 信 和 号 量 。 


2b "Ill E, 


我 们 现在 开发 一 些 简单 的 程序 来 测量 这 些 IPC 类 型 的 性 能 ， 这 样 有 


比较 不 同形 式 的 消息 传递 时 ， 我 们 感 兴趣 的 是 以 下 两 种 测量 尺度 。 
(1) 带 宽 (bandwidth) : 数据 通过 IPC 通 道 转移 的 速度 。 为 测量 该 








我 们 


道 和 FIFO 的 write 和 read 操 作 ) 测量 该 
竺 发 现 珊 宽 随 每 个 IO 操作 数据 量 的 增长 而 增长 的 规律 。 


(2)&8E3R Clatency) : 一 个 小 的 IPC 消 息 从 一 个 进程 到 另 一 个 进程 再 
返回 所 花 的 时 间 。 我 们 测量 的 是 只 有 1 个 字 节 的 消息 从 一 个 进程 到 另 一 
个 进程 再 回来 的 时 间 (往返 时 | 间 〉。 

在 现实 世界 中 ， 和 带宽 告诉 我 们 大 块 数据 通过 一 个 IPC 通 道 发 送出 去 
需 花 多 长 时 间 ， 然 而 IPC 也 用 于 传送 小 的 控制 消息 ， 系 统 处 理 这 些小 消 
奶 所 需 的 时 间 就 由 延迟 提供 。 这 两 个 数 都 很 重要 。 

为 测量 各 种 同步 形式 的 性 能 ， 我 们 来 修改 将 处 于 共享 内 存 区 中 的 一 
个 计数 器 持续 加 1 的 程序 ， 该 程序 或 者 由 多 个 线程 给 该 计数 名 每 次 加 1， 
或 者 由 多 个 进程 给 该 计数 器 每 次 加 1。 既 然 加 1 是 个 简单 的 操作 ， 因 此 它 
所 需 的 时 间 差 不 多 由 同步 原 语 操作 的 时 间 决 定 。 

本 附录 中 用 于 测量 各 种 形式 IPC 之 性 能 的 简单 程序 大 体 上 基于 
[McVoy and Staelin 1996 ] 中 描述 的 Imbench 标 准 测 量程 序 
(benchmark) 套件 。 这 是 一 套 复 杂 精 致 的 标准 测量 程序 ， 用 于 测量 一 
个 Unix 系 统 的 许多 特征 “上下文 切换 时 间 、LO 知 吐 量 ， 等 等 ) ， 而 不 
光 是 IPC。 它 们 的 源 代码 是 公开 可 得 的 : 

http://www.bitmover.com/Imbench. 

本 附录 中 给 出 的 各 个 数值 是 为 让 我 们 比较 本 书 中 讲述 的 各 种 技术 而 
提供 的 。 所 上 暗含 的 一 个 动机 是 展示 测量 这 些 值 是 多 么 地 简单 。 在 从 各 种 
技术 中 作出 选择 之 前 ， 你 必须 测量 自己 的 系统 的 这 些 性 能 数值 。 不 幸 的 
是 ， 束 像 测 量 数值 之 易 的 程度 一 样 ， 当 检测 到 反 第 现象 时 ， 在 没 法 访问 
出 问题 的 内 核 或 函数 库 的 源 代 人 码 的 情况 下 ,解释 起 来 往往 非常 困难 。 

A.2 结果 

现在 汇总 出 自 本 附录 的 所 有 结果 ， 目 的 是 在 逐个 查看 我 们 给 出 的 各 
个 程序 的 过 程 中 提供 方便 的 指引 。 

用 于 所 有 测量 的 两 个 系统 是 运行 Solaris 2.6 的 一 台 SparcStation 4/110 
和 运行 Digital Unix 4.0B 的 一 台 Digital Alpha (DEC 3000 型 号 300， 
Pelican) 。 往 该 Solaris 系 统 的 /etcsystem 文 件 中 添加 了 以 下 各 行 : 























set msgsys:msginfo_msgmax = 16384 

set msgsys:msginfo_msgmnb = 32768 

set msgsys:msginfo_msgseg = 4096 

这 样 允 许 在 System = VIRB K ADA 1638447 ES CA 
A-2) 。 通 过 作为 sysconfig 程 序 的 输入 指定 以 下 各 行 ， 对 该 Digital Unix 
系统 进行 同样 的 修改 : 


ipc: 





msg-max = 16384 
msg-mnb = 32768 
A.2.1 消息 传递 市 宽 结 果 
图 A-2 列 出 了 在 运行 Solaris 2.6 的 一 台 Sparc 主 机 上 测 得 的 带宽 结果 ， 
图 A-3 图 示 了 这 些 值 。 图 A-4 列 出 了 在 运行 Digital Unix 4.0B 的 一 合 Alpha 
主机 上 测 得 的 带宽 结 末 ， 图 A-5 图 示 了 这 些 值 。 
正如 我 们 可 能 预期 的 那样 ， 讲 宽 通 常 随 消 妃 大 小 的 增长 而 增长 。 由 
于 System V 消 息 队 列 的 实现 具有 较 小 的 内 核 限制 值 (3.8 节 ) ， 因 此 最 大 
的 消息 是 16384 字 节 ， 而 且 即 使 对 于 这 个 大 小 的 消息 ， 内 核 默 认 值 也 不 
得 不 增加 。Solaris 系 统 的 带宽 在 4096 字 节 以 上 时 减 小 的 可 能 原因 在 于 内 
部 消息 队列 限制 的 配置 。 为 跟 UNPv1 比 较 ， 我 们 还 给 出 了 TCP 套 接 字 和 
Unix 域 套 接 字 的 值 。 这 两 个 值 是 使 用 Imbench 软 件 包 中 的 程序 测 得 的 ， 
只 使 用 了 大 小 为 65536 字 节 的 一 种 消息 。 对 于 TCP 套 接 字 的 测量 ， 它 的 
两 个 进程 处 于 同一 台 主 机 中 。 
A.2.2 消息 传递 延迟 结果 
图 A-1 列 出 了 在 Solaris 2.6 和 Digital Unix 4.0B 下 测 得 的 延迟 结果 。 

















HEIR Cus) 
管道 Posix 消 | System V py | Sun RPC | Sun RPC TCP UDP | Unix 域 
息 队 列 | 消息 队列 TCP UDP | ERF | 套 接 字 | BRF 





DUnix 4.0B | 574 995 625 1648 1373 848 639 289 
图 A-1 使 用 各 种 形式 的 IPC 交 换 一 个 1 字 节 消息 的 延迟 
在 A.4 节 中 我 们 将 给 出 测量 其 中 前 6 个 值 的 程序 ， 剩 下 3 个 值 则 出 自 
lmbench 套 件 。 对 于 TCP 和 UDP 的 测量 ， 它 们 的 两 个 进程 都 处 于 同一 台 
ALE. 


带宽 (MB/s) 


mn Posix System V Sun RPC | Sun RPC TCP Unix 域 
管道 | 消息 队列 | 消息 队列 TCP UDP | 套 接 字 | 套 接 字 





图 A-2 各 种 类 型 消息 传递 的 带宽 (Solaris 2.6) 
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图 A-3 各 种 类 型 消息 传递 的 带宽 CSolaris 2.6) 


宽 (MBit/s) 


A^ 管道 Posix System V | Sun RPC | Sun RPC TCP Unix 域 
消息 队列 | 消息 队列 TCP UDP 套 接 字 套 接 字 








图 A-4 各 种 类 型 消息 传递 的 带宽 (Digital Unix 4.0B ) 
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1024 4096 8192 16384 32768 65536 
消息 大 小 CETO 
图 A-5 各 种 类 型 消息 传递 的 带宽 (Digital Unix 4.0B ) 

A.2.3 线程 同步 结 

图 A-6 列 出 了 Solaris 2.6 下 使 用 各 种 形式 的 同步 ， 由 一 个 或 多 个 线程 
给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 ， 图 A-7 图 示 了 这 
些 值 。 每 个 线程 给 该 计数 器 加 1 共 1 000 000 次 ， 这 样 的 线程 数 则 从 1 到 5 
变化 。 图 A-8 列 出 了 Digital Unix ”4.0B 下 的 这 些 值 ， 图 A-9 图 示 了 这 些 
值 。 

增加 线程 数 的 原因 在 于 验证 使 用 同步 技术 的 代码 是 正确 的 ， 并 得 看 
时 间 是 否 随 线程 数 的 增加 而 开始 非 线 性 地 增长 。 对 于 fcnti 记 录 上 锁 我 们 
只 能 测量 单个 线程 ， 因 为 这 种 同步 形式 工作 于 进程 间 ， 而 不 是 单个 进程 
内 的 多 个 线程 间 。 

Digital ”Unix 下 ， 线 程 数 多 于 一 个 时 两 种 Posix 信 号 量 类 型 的 时 间 变 
得 非常 大 ， 表 明 存 在 某 种 类 型 的 反常 。 我 们 没有 图 示 这 些 值 。 












































出 现 这 些 比 预期 值 大 的 数值 的 可 能 原因 之 一 是 ， 本 程序 是 一 个 病态 
的 同步 测试 程序 。 也 就 是 次 ， 各 个 线程 除 同步 外 什么 都 不 干 ， 因 而 其 中 
的 锁 基 本 上 所 有 时 间 都 为 茶 个 线程 所 锁 住 。 既 然 默 认 情 况 下 线程 是 以 进 
程 鄞 用 范围 属性 创建 的 ， 因 此 每 当 一 个 线程 失去 它 的 时 间 片 时 ， 它 可 能 
仍 持 有 该 锁 ， 于 是 切换 来 运行 的 新 线程 可 能 立即 阻 紧 。 


给 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 时 间 Cs) 





90 fcnt1 记 录 上 锁 
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图 A-7 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 
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图 A-9 AA FH 


享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Digital Unix 4.0B ) 


A.2.4 进程 同步 结果 
图 A-6、 图 A-7、 图 A-8 和 图 A-9 展 示 了 各 种 同步 技术 用 于 同步 单个 


进程 内 的 各 个 线程 时 测 得 的 结果 。 图 A-10 和 图 A-11 给 出 了 Solaris 





2.6 下 





在 不 同 进程 间 共 享 计 数 占 时 这 些 同步 技术 的 性 能 。 图 A-12 和 图 A-13 给 出 
J Digital Unix 4.0B 下 的 进程 同步 结果 。 这 些 结果 与 对 应 的 线程 同步 结 


类 似 ， 不 过 两 种 Posix 


> o = 
H y 5H 


形式 的 值 现 在 类 似 于 Solaris 的 结果 。 我 们 只 


画 出 了 fentl 记 录 上 锁 的 第 一 个 值 ， 因 为 其 余 各 值 太 大 了 。 正 如 我 们 在 7.2 


节 中 注 出 的 那样 ，Digital Unix 4.0B 不 文 持 
PTHREAD_PROCESS_SHARED 特 性 ， 因 此 我 们 无 法 测量 不 同 进 程 间 的 
互 斥 锁 值 。 在 Digital Unix 下 当 涉 及 多 个 进程 时 ， 我 们 再 次 看 到 了 Posix 
言 写 量 的 某 种 类 型 的 反 第 。 


给 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 时 间 Cs) 
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图 A-10 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 
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图 A-11 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 
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图 A-12 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Digital Unix 4.0B) 
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图 A-13 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Digital Unix 4.0B) 

A.3 消息 传递 带宽 程序 

本 节 给 出 测量 管道 、Posix 消 息 队 列 、System V 消 息 队 列 、 门 和 Sun 
RPC 的 带宽 的 各 个 程序 。 我 们 已 在 图 A-2 和 图 A-3 中 给 出 了 这 些 程序 的 结 
R, 





A.3.1 管道 带宽 程序 
图 A-14 展 示 了 我 们 将 描述 的 程序 的 概貌 。 


图 A-15 给 出 了 我 们 的 bw_pipe 程 序 的 前 半 部 分 ， 它 测量 一 个 管道 的 
ah 


"s 
父 进程 子 进 程 
main( ) 
{ 
Pipe (contpipe); 
Pipe(datapipe); Forki 
if (Fork() == 0) if (Fork() == 
writer( ); 
exit (0); 
} 
reader( ); 
exit (0); 
reader( ) writer( ) 
( 空 制 管道 ， 待 发 送 字 节 娄 
给 本 函 Write(contpipe[1], ); 控制 管道 ; 竺 rA Read(contpipe[0], ); 
数 计时 while (more to receive) while (more to send) 


Read(datapipe[0], ); m — Write(datapipe[1], ); 





图 A-14 测量 一 个 管道 的 带宽 的 程序 的 概貌 








bench/bw_pipe.c 











1 #include "unpipc.h" 
2 void reader(int, int, int); 
3 void writer(int, int); 
4 void *buf; 
5 ant totalnbytes, xfersize; 
6 int 
7 main(int argc, char **argv) 
8 ( 
9 int i, nloop, contpipe[2], datapipe[2]; 
10 pid t childpid; 
11 if (argc != 4) 
12 err quit("usage: bw pipe <#loops> <#mbytes> <#bytes/write>") ; 
13 nloop = atoi(argv[1]); 
14 totalnbytes - atoi(argv[2]) * 1024 * 1024; 
15 xfersize = atoi(argv[3]); 
16 buf = Valloc(xfersize) ; 
17 Touch(buf, xfersize); 
18 Pipe (contpipe) ; 
19 Pipe (datapipe) ; 
20 if ( (childpid = Fork()) == 0) 
21 writer (contpipe[0], datapipe[1]);  /* child */ 
22 exit (0) ; 
23 } 
24 /* parent */ 
25 Start time(); 
26 for (i = 0; i « nloop; i++) 
27 reader(contpipe[1], datapipe[0], totalnbytes); 
28 printf("bandwidth: $.3f MB/sec\n", 
29 totalnbytes / Stop time() * nloop); 
30 kill(childpid, SIGTERM); 
31 exit (0); 
32 } 
bench/bw pipe.c 
图 A-15 一 个 管道 带宽 测量 程序 的 main 函 数 
Ly AAS MZ 
命令 行 参数 


11—15 ”命令 行 参数 指定 待 执行 的 循环 数 〈 以 下 测量 中 的 典型 值 为 
5) 、 待 传送 的 M 字 节 [1] 数 〈 值 为 10 的 参数 导致 传送 10x1024x1024 字 
节 ) 以 及 每 次 write 和 read 的 字 节 数 〈 我 们 给 出 的 测量 结果 中 该 值 在 1024 
和 65536 之 间 变 化 ) 。 

分 配 缓冲 区 并 触及 它 的 各 个 页 面 

16—17 valloc 是 malloc 的 版 本 之 一 ， 它 从 某 个 页 面 边 界 开 始 分 配 所 
请 求 数量 的 内 存 空间 。 我 们 的 函数 touch (图 A-17) 在 该 缓冲 区 的 每 个 








页 面 中 存 入 1 字 市 的 数据 ， 从 而 迫使 内 核 把 构成 该 缓冲 区 的 每 个 页 面 置 





换 进 内 存 。 我 们 在 进行 计时 之 前 完成 这 些 工 作 。 

valloc 不 属于 Posix.1 函 数 ，Unix 98 把 它 列 为 一 个 “ 代 传 〈legacy) "$E 
O: 早期 版 本 的 X/Open 规范 需要 它 ， 但 它 现 在 是 可 选 的 。 如 果 valloc 不 
受 文 持 ， 我 们 的 Valloc 包 于 函 数 就 调用 malloc 来 实现 它 的 功能 。 

创建 两 个 管道 

18~19 创建 两 个 管道 ， 其 中 contpipe[0] 和 contpipe[1] 用 于 在 开始 每 
次 传送 之 前 同步 一 读 一 写 两 个 进程 ，datapipe[0] 和 datapipe[1] 用 于 真正 的 
数据 传送 。 

调用 fork 派 生子 进程 

20—31 ， 行 派生 一 个 子 进程 ， 该 子 进程 〈 它 的 fork 返 回 值 为 0) 调用 
writer 国 数 ， 父 进程 则 调用 reader 函 数 。 父 进程 中 reader 函 数 调用 nloop 
次 。 我 们 的 start_time 函 数 在 该 循环 开始 前 即刻 调用 ， 我 们 的 stop_time 杨 
数 在 该 循环 终止 后 马上 调用 。 图 A-17 给 出 了 这 两 个 函数 。 所 输出 的 带宽 
为 每 次 循环 传送 的 总 字 市 数 除 以 传送 数据 所 花 的 时 间 (stop_time 返 回 的 
是 自 调用 start_time 以 来 流逝 的 微 秒 数 ) ， 再 乘 以 循环 次 数 。 子 进程 随后 
被 父 进程 发 送 的 SIGTERM 信 号 杀 死 ， 程 序 随后 终止 。 

图 A-16 给 出 了 bw_pipe 程 序 的 后 半 部 分 ， 它 包含 两 个 函数 writer 和 


reader。 








bench/bw_pipe.c 





33 void 

34 writer(int contfd, int datafd) 

35 ( 

36 int ntowrite; 

37 for (ae)! { 

38 Read(contfd, &ntowrite, sizeof (ntowrite) ); 
39 while (ntowrite > 0) { 

40 Write(datafd, buf, xfersize); 
41 ntowrite -- xfersize; 

42 } 

43 } 

44 } 

45 void 

46 reader(int contfd, int datafd, int nbytes) 
47 { 

48 ssize t n; 

49 Write(contfd, &nbytes, sizeof (nbytes) ) ; 


50 while ((nbytes > 0) && 

51 ( (n = Read(datafd, buf, xfersize)) > 0)) { 
52 nbytes -= n; 

53 ) 





bench/bw pipe.c 








图 A-16 测量 一 个 管道 的 带宽 的 writer 和 reader 函 数 








writer PK Zi 

33—44 ”本 函数 是 由 子 进程 调用 的 一 个 无 限 循 环 。 子 进程 通过 在 控 
制 管道 读 出 一 个 整数 《该 整数 指定 子 进程 应 写 入 数据 管道 的 字 节 数 ) ， 
来 等 待 父 进 程 表明 自 喘 已 准备 好 接收 数据 。 接 收 到 这 个 通知 后 ， 子 进程 
通过 管道 问 父 进程 写 入 数据 ， 每 次 write 调用 写 xfersize 个 字 节 。 

reader PK Zi 

45—54 ”本 函数 是 由 父 进 程 在 一 个 循环 中 调用 的 。 它 每 次 被 调用 时 
往 控制 管道 写 入 一 个 整数 ， 告 诉 子 进 程 应 往 数 据 管道 中 写 入 多 少 字 节 的 
数据 。 本 函数 随后 在 一 个 循环 中 调用 read， 直 到 全 部 数据 都 接收 完 为 
flee 

图 A-17 给 出 了 我 们 的 start_time、stop_time 和 touch 函 数 。 





lib/timing.c 





1 #include "unpipc.h" 
2 static struct timeval tv start, tv stop; 
3 int 
4 start time(void) 
5 { 
6 return (gettimeofday (&tv_start, NULL)) ; 
T 
8 double 
9 stop time (void) 
10 ( 
1l double clockus; 
12 if (gettimeofday(&tv stop, NULL) -- -1) 
13 return(0.0); 
14 tv sub(&tv stop, &tv start); 
15 clockus = tv stop.tv sec * 1000000.0 + tv stop.tv usec; 
16 return (clockus) ; 
13 i} 
18 int 
19 touch(void *vptr, int nbytes) 
20 { 
21 char *cptr; 
22 static int  pagesize = 0; 
23 if (pagesize -- 0) { 
24 errno - 0; 
25 #ifdef | SC PAGESIZE 
26 if ( (pagesize - sysconf( SC PAGESIZE)) -- -1) 
27 return(-1); 
28 #else 
29 pagesize - getpagesize(); /* BSD */ 
30 #endif 
3 ) 
32 cptr = vptr; 
33 while (nbytes > 0) { 
34 *optr = 1; 
35 cptr += pagesize; 
36 nbytes -= pagesize; 
37 } 
38 return (0) ; 
39 } 





lib/timing.c 
图 A-17 计时 函数 : start time. stop_time#ltouch 


图 A-18 给 出 了 tv_sub 函 数 ， 它 在 两 个 timeval 结 构 间 做 减法 运算 ， 并 
把 结果 存 回 第 一 个 结构 中 。 





lib/tv_sub.c 


1 #include "unpipc.h" 

2 void 

3 tv sub(struct timeval *out, struct timeval *in) 

XE 

5 if ( (out-»tv usec -= in-»tv usec) < 0) ( /* out -- in */ 
6 --out-»tv sec; 

7 out-»tv usec «- 1000000; 

8 ) 

9 out-»tv sec -= in-»tv sec; 
10 } 


lib/tv_sub.c 





图 A-18 tv_sub 函 数 : 两 个 timeval 结 构 相 减 

在 运行 Solaris 2.6 的 一 侣 Sparc 主 机 上 接连 运行 我 们 的 程序 5 次 ， 得 到 
如 下 结果 : 

solaris % bw_pipe 5 10 65536 

bandwidth: 13.722 MB/sec 

solaris % bw_pipe 5 10 65536 

bandwidth: 13.781 MB/sec 

solaris % bw_pipe 5 10 65536 

bandwidth: 13.685 MB/sec 

solaris % bw_pipe 5 10 65536 

bandwidth: 13.665 MB/sec 

solaris % bw_pipe 5 10 65536 

bandwidth: 13.584 MB/sec 

每 次 我 们 指定 5 轮 循环 ， 每 轮 循环 传送 10 485 760 个 字 节 ， 每 次 write 
和 read 调 用 收发 65536 个 字 节 。 这 5 次 程序 运行 的 平均 值 为 图 A-2 中 上 押 示 
的 13.7MB/s。 

A.3.2 Posix 消 息 队 列 带宽 程序 

图 A-19 是 一 个 Posix 消 息 队 列 囊 宽 测量 程序 的 main 函 数 。 图 A-20 给 
出 了 其 中 的 writer 和 reader 函 数 。 该 程序 与 前 面 那个 管道 囊 宽 测量 程序 类 
似 。 











bench/bw pxmsg.c 











1 #include "unpipc.h" 
2 #define NAME "bw pxmsg" 
3 void reader (int, mgd t, int); 
4 void writer (int, mgd. t); 
5 void *buf; 
6 int totalnbytes, xfersize; 
" Int 
8 main(int argc, char **argv) 
9 1 
10 int i, nloop, contpipe[2]; 
BL mgd t mq; 
12 pidt childpid; 
13 struct mq attr attr; 
14 if (argc != 4) 
T5 err_quit ("usage: bw_pxmsg <#loops> <#mbytes> <#bytes/write>") ; 
16 nloop = atoi(argv[1]) ; 
图 A-19 Posix 消 息 队 列 带宽 测量 程序 的 main 函 数 
17 totalnbytes = atoi(argv[2]) * 1024 * 1024; 
18 xfersize = atoi(argv[3]); 
19 buf = Valloc(xfersize) ; 
20 Touch(buf, xfersize) ; 
21 Pipe (contpipe) ; 
22 mq unlink(Px ipc name(NAME)); /* error OK */ 
23 attr.mq maxmsg - 4; 
24 attr.mq msgsize - xfersize; 
25 mq - Mq open(Px ipc name(NAME), O RDWR | O CREAT, FILE MODE, &attr); 
26 if ( (childpid = Fork()) == 0) { 
27 writer(contpipe[0], mq); /* child */ 
28 exit (0); 
29 } 
30 /* parent */ 
cul Start time(); 
32 for (i = 0; i < nloop; i++) 
33 reader(contpipe[1], mg, totalnbytes); 
34 printf ("bandwidth: $.3f MB/sec\n", 
35 totalnbytes / Stop time() * nloop); 
36 kill(childpid, SIGTERM); 
37 Mq close (mq); 
38 Mq unlink(Px ipc name (NAME) ) ; 
39 exit (0); 
40 ) 


图 A-19 CÈ) 


bench/bw_pxmsg.c 





bench/bw_pxmsg.c 


41 void 

42 writer(int contfd, mqd_t mqsend) 

43 { 

44 int ntowrite; 

45 for ( pa) { 

46 Read(contfd, &ntowrite, sizeof (ntowrite) ); 
47 while (ntowrite > 0) { 

48 Mq_send(mqsend, buf, xfersize, 0); 
49 ntowrite -= xfersize; 

50 } 

51 } 

52 } 

53 void 

54 reader (int contfd, mqd t mqrecv, int nbytes) 
55 ( 

56 ssize t n; 

57 Write(contfd, &nbytes, sizeof (nbytes)); 

58 while ((nbytes » 0) && 

59 ( (n = Mq receive(mgrecv, buf, xfersize, NULL)) > 0)) ( 
60 nbytes -= n; 

61 } 

62 } 





bench/bw_pxmsg.c 
图 A-20 测量 一 个 Posix 消 息 队 列 的 带宽 的 wirter 和 reader 函 数 

注意 ， 在 我 们 创建 消息 队列 时 ， 必 须 指定 该 程序 上 能 存在 的 最 大 消 
因数 ， 我 们 把 它 指定 为 4。IPC 通 道 的 容量 能 够 影响 性 能 ， 因 为 写 进程 在 
阻塞 于 某 个 mqsend 调 用 之 前 能 够 发 送 这 么 多 的 消息 ， 然 后 由 内 核 将 上 下 
文 切换 到 读 进 程 。 因 此 本 程序 的 性 能 依赖 于 这 个 魔 数 。Solaris 2.6 FHE 
该 数 从 4 改 为 8 并 不 影响 图 A-2 中 的 各 个 数值 ， 然 而 Digital Unix 4.0B 下 的 
同样 变动 却 使 性 能 下 降 了 12%。 我 们 原本 会 猜想 消息 数 较 多 时 性 能 将 增 
长 ， 因 为 这 可 以 让 上 下 文 切 换 数 降低 一 半 。 然 而 如 果 用 到 了 内 存 映射 文 
件 ， 那 么 这 样 一 来 将 使 该 文件 的 大 小 增加 一 倍 ， 所 映射 的 内 存 区 大 小 也 
增长 一 倍 。 

A.3.3 System V 1H I DÀ Fiir và FE 

图 A-21 是 一 个 System V 消 息 队列 带宽 测量 程序 的 main 函 数 ， 图 A-22 
给 出 了 其 中 的 writer 和 reader 函 数 。 








1 #include "unpipc.h" 
2 void reader(int, int, int); 
3 void writer(int, int); 


4 struct msgbuf *buf; 


5 int totalnbytes, xfersize; 
6 int 
7 main(int argc, char **argv) 
8 { 
9 int i, nloop, contpipe[2], msqid; 
10 pid t  childpid; 
11 if (argc !- 4) 
12 err quit("usage: bw svmsg <#loops> <#mbytes> <#bytes/write>") ; 
13 nloop = atoi(argv[11); 
14 totalnbytes - atoi(argv[2]) * 1024 * 1024; 
15 xfersize - atoi(argv[3]); 
16 buf = Valloc(xfersize) ; 
17 Touch (buf, xfersize) ; 
18 buf->mtype = 1; 
19 Pipe (contpipe) ; 
20 msqid = Msgget (IPC_ PRIVATE, IPC_CREAT | SVMSG MODE) ; 
21 if ( (childpid = Fork()) == 0) { 
220 writer(contpipe[0], msqid); /* child */ 
23 exit(0); 
24 } 
25 Start time(); 
26 for (i = 0; i < nloop; i++) 
27 reader(contpipe[1], msgid, totalnbytes); 
28 printf ("bandwidth: $.3f MB/sec\n", 
29 totalnbytes / Stop time() * nloop); 
30 kill(childpid, SIGTERM); 
ST Msgctl(msqid, IPC RMID, NULL); 
32 exit(0); 
33 7 





图 A-21 一 个 System V 消 息 队列 带宽 测量 程序 的 main 函 数 





bench/bw_svmsg.c 


bench/bw svmsg.c 





bench/bw_svmsg.c 


34 void 

35 writer(int contfd, int msqid) 

36 ( 

37 int ntowrite; 

38 for (3) { 

39 Read(contfd, &ntowrite, sizeof (ntowrite)); 
40 while (ntowrite > 0) ( 

41 Msgsnd(msqid, buf, xfersize - sizeof(long), 0); 
42 ntowrite -- xfersize; 

43 } 

44 } 

45 } 

46 void 

47 reader(int contfd, int msgid, int nbytes) 

48 ( 

49 ssize t n; 

50 Write(contfd, &nbytes, sizeof (nbytes)); 

51 while ((nbytes » 0) && 

52 ( (n = Msgrcv(msqid, buf, xfersize - sizeof(long), 0, 0)) > 0)) ( 
53 nbytes -- n + sizeof (long); 

54 ) 

55 } 


bench/bw svmsg.c 





图 A-22 测量 一 个 System V 消 息 队 列 的 带宽 的 writer 和 reader 函 数 


A.3.4 门 带宽 程序 

门 API 带 宽 测 量程 序 比 本 节 中 先前 给 出 的 程序 要 复杂 ， 因 为 在 创建 
其 中 的 门 之 前 必须 fork 出 子 进程 。 父 进程 接着 创建 该 门 ， 并 通过 写 一 个 
管道 来 通知 子 进程 该 门 能 被 打开 。 

不 像 图 A-14 的 另 一 个 变化 是 ，reader 函 数 不 接 收 数据 。 相 反 ， 数 据 
是 由 名 为 server 的 函数 接收 的 ， 它 是 对 应 门 的 服务 器 过 程 。 图 A-23 给 出 
了 该 程序 的 概貌 。 

门 只 在 Solaris 下 受 支 持 ， 于 是 我 们 通过 假设 采用 全 双 工 管道 (4.4 
节 ) 来 简化 程序 本 身 。 

与 先前 的 程序 相 比 ， 另 一 个 变化 在 于 消息 传递 和 过 程 调用 间 的 基本 
差异 。 例 如 在 我 们 的 Posix 消 息 队 列 程序 中 ， 写 入 者 只 是 在 一 个 循环 中 
往 一 个 队列 写 入 消息 ， 这 种 写 操作 是 异步 的 。 到 某 个 时 刻 队列 满 了 ， 或 














者 写 进 程 丧 失 了 自己 的 处 理 器 时 间 片 ， 读 出 者 就 开始 运行 ， 读 出 这 些 消 
上 息 。 举 例 来 说 ， 如 果 该 队列 可 容纳 8 个 消息 ， 而 且 写 入 者 每 次 运行 时 写 
入 8 个 消息 ， 读 出 者 每 次 运行 时 读 出 所 有 8 个 消 已 ， 那 么 发 送 N 个 消息 将 
涉及 N/4 次 上 下 文 切换 (其 中 N/8 次 是 从 写 入 者 到 读 出 者 ， 男 外 N/8 次 是 
从 读 出 者 到 写 入 者 ) 。 然 而 门 API 是 同步 的 : 调用 者 每 次 调用 door_call 
时 阻塞 ， 直 到 服务 喜 过 程 返 回 才 能 恢复 。 交 换 N 个 消 上 息 现在 涉及 Nx2 次 
上 下 文 切换 。 测 量 RPC 调 用 的 带宽 时 ， 我 们 将 合 到 同样 的 问题 。 尽 管 上 
下 文 切换 数 增 加 了 ， 从 图 A-3 可 以 看 出 ， 当 消息 大 小 在 约 25000 字 节 或 以 
上 时 ， 门 却 提 供 了 最 快 的 IPC 和 市 宽 。 

图 A-24 给 出 了 该 程序 的 main 函 数 。writer、server 和 reader 函 数 则 在 
图 A-25 中 给 出 。 











父 进程 = 






main () 


{ 









Pipe (contpipe) ; 
Je (FO) == 0 eterne if (Fork() == 0) { 
Read (contpipr [0], ); 
doorfa = Open(); 
writer (); 

exit (0); 


















} 


doorfd = Door create(); 
Fattach () ; 
Write(contpipe[1], ); 










reader (); 
0); 







exit ( 












writer () 


{ 








Read(contpipe[0], ); 










门 服务 if (end of data) while (more to send); 
器 过 程 write(contpipe[0], ); Write(datapipe[1], ); 
Door return(); Door call(); 
reader() 
e ASH Write(contpipe[1], ); 
数 计 时 rite pip 7 ; 





Read(contpipe[1], ); 






) 




















图 A-23 门 API 带 宽 测 量程 序 的 概貌 


bench/bw_door.c 





1 #include "unpipc.h" 
2 void reader(int, int); 
3 void writer (int); 
4 void server(void *, char *, size t, door desc t *, size t); 
5 void *buf; 
6 int totalnbytes, xfersize, contpipe[2]; 
7 int 
8 main(int argc, char **argv) 
9 { 
10 int i, nloop, doorfd; 
11 char e 
12 pid t  childpid; 
13 ssize t n; 
14 if (arge != 5) 
15 err quit("usage: bw door «pathname» <#loops> <#mbytes> <#bytes/write>") ; 
16 nloop = atoi (argv[2]1); 
17 totalnbytes = atoi(argv[3]) * 1024 * 1024; 
18 xfersize = atoi(argv[4]); 
19 buf = Valloc(xfersize) ; 
20 Touch (buf, xfersize) ; 
图 A-24 门 API 带 宽 测量 程序 的 main 函 数 
2 unlink (argv [1] ) ; 
22 Close (Open(argv[1], O CREAT | O EXCL | O_RDWR, FILE MODE)); 
23 Pipe (contpipe) ; /* assumes full-duplex SVR4 pipe */ 
24 if ( (childpid = Fork()) == 0) ( 
25 /* child = client = writer */ 
26 if ( (n = Read(contpipe[0], &c, 1)) != 1) 
27 err quit("child: pipe read returned $d", n); 
28 doorfd - Open(argv[1], O RDWR); 
29 writer (doorfd); 
30 exit (0); 
31 } 
32 /* parent = server = reader */ 
33 doorfd = Door create(server, NULL, 0); 
34 Fattach(doorfd, argv[1]); 
35 Write(contpipe[1], &c, 1); /* tell child door is ready */ 
36 Start time(); 
37 for (i = 0; i « nloop; i++) 
38 reader (doorfd, totalnbytes); 
39 printf ("bandwidth: $.3f MB/sec\n", 
40 totalnbytes / Stop time() * nloop); 
41 kill (childpid, SIGTERM) ; 
42 unlink (argv [1] ) ; 
43 exit (0) ; 
44 } 





图 A-24 CH 


bench/bw_door.c 


bench/bw_door.c 











45 void 
46 writer(int doorfd) 
47 ( 
48 int ntowrite; 
49 door arg t arg; 
50 arg.desc ptr - NULL; /* no descriptors to pass */ 
51 arg.desc num - 0; 
52 arg.rbuf - NULL; /* no return values expected */ 
53 arg.rsize - 0; 
54 for (;;)1 
55 Read(contpipe[0], &ntowrite, sizeof (ntowrite) ) ; 
56 while (ntowrite > 0) { 
57 arg.data_ptr = buf; 
58 arg.data_size = xfersize; 
59 Door_call(doorfd, &arg) ; 
60 ntowrite -= xfersize; 
61 } 
62 } 
63 } 
64 static int ntoread, nread; 
65 void 
66 server(void *cookie, char *argp, size_t arg_size, 
67 door_desc_t *dp, size_t n_descriptors) 
68 ( 
图 A-25 MÆ JAPIK t $E writer, serverfllreaderrk Zi 
69 char o 
70 nread «- arg size; 
ud if (nread >= ntoread) 
72 Write(contpipe[0], &c, 1); /* tell reader() we are all done */ 
73 Door return(NULL, 0, NULL, 0); 
74 } 
75 void 
76 reader(int doorfd, int nbytes) 
7 4 
78 char Cy 
79 ssize t n; 
80 ntoread - nbytes; /* globals for server() procedure */ 
81 nread - 0; 
82 Write(contpipe[1], &nbytes, sizeof (nbytes)); 
83 if ( (n = Read(contpipe[1], &c, 1)) != 1) 
84 err quit("reader: pipe read returned $d", n); 
85 } 


KlA-25 (2) 


bench/bw door.c 


A.3.5 Sun RPC 带 宽 程 序 


既然 Sun RPC 中 的 过 程 调 用 是 同步 的 ， 那 么 我 们 有 已 随 前 面 的 门 程 


序 提 到 过 的 同样 限制 。 


使 用 RPC 时 生成 一 个 客户 和 一 个 服务 需 两 个 程序 


更 为 容易 ， 因 为 它们 是 由 rpcgen 生 成 的 。 图 A-26 给 出 了 本 程序 的 RPC 说 


明 书 文件 。 我 们 声明 了 单个 过 程 ， 








入 ， 不 返回 任何 东西 。 


它 以 一 个 可 变 长 度 不 透明 数据 作为 输 


bench/bw sunrpc.x 





1 %#define DEBUG 


2 struct data in ( 
3 opaque data<>; 
4 }; 


5 program BW_SUNRPC_PROG { 
6 version BW_SUNRPC_VERS { 

7 void BW SUNRPC(data in) 
8 } = 1; 

9 } = 0x31230001; 


/* so server runs in foreground */ 


/* variable-length opaque data */ 


= s 





图 A-26 Sun RPC 带 





bench/bw sunrpc.x 


带宽 测量 程序 的 RPC 说 明 书 文件 


图 A-27 给 出 了 我 们 的 客户 程序 ， 图 A-28 给 出 了 我 们 的 服务 器 过 程 。 





我 们 把 协议 〈TCP 或 UDP) 指定 为 客户 程序 的 一 个 命令 和 


分 别 测量 这 两 种 协议 。 


J 参数 ， 以 允许 


bench/bw_sunrpc_client.c 





1 #include 
2 #include 


"unpipc.h" 
"bw sunrpc.h" 


3 void 
4 int 


*buf; 
totalnbytes, xfersize; 


5 int 





图 A-27 测量 Sun RPC 的 


带宽 的 RPC 客 户 程 序 


6 main(int argc, char **argv) 


11 
8 int i, nloop, ntowrite; 
9 CLIENT *cl; 
10 data in in; 
TT if (argc !- 6) 
12 err quit("usage: bw sunrpc client «hostname» <#loops>" 
13 " <#mbytes> <#bytes/write> <protocol>") ; 
14 nloop = atoi(argv[2]); 
15 totalnbytes = atoi(argv[3]) * 1024 * 1024; 
16 xfersize = atoi(argv[4]); 
17 buf = Valloc(xfersize) ; 
18 Touch (buf, xfersize) ; 
19 cl = Clnt create(argv[1], BW SUNRPC PROG, BW SUNRPC VERS, argv[5]); 
20 Start time(); 
21 for (i = 0; i < nloop; i++) { 
22 ntowrite = totalnbytes; 
23 while (ntowrite > 0) { 
24 in.data.data_len = xfersize; 
25 in.data.data_val = buf; 
26 if (bw_sunrpc_1(&in, cl) == NULL) 
27 err quit("$s", clnt_sperror(cl, argv[1])); 
28 ntowrite -= xfersize; 
29 } 
30 } 
31 printf ("bandwidth: $.3f MB/sec\n", 
32 totalnbytes / Stop time () * nloop); 
33 exit (0) ; 
34 } 
bench/bw_sunrpc_client.c 
图 A-27( 续 ) 
bench/bw_sunrpc_server.c 
1 #include "unpipc.h" 
2 #include "bw sunrpc.h" 


3 #ifndef RPCGEN ANSIC 
4 #define bw sunrpc 1 svc bw sunrpc 1 
5 #endif 


void * 


6 
7 bw sunrpc 1 svc(data in *inp, struct svc req *rqstp) 
8 
9 


{ 


static int nbytes; 


10 nbytes - inp-»data.data len; 
11 return (&nbytes) ; /* must be nonnull, but xdr_void() will ignore */ 
12 } 





图 A-28 测量 Sun RPC 的 带宽 的 RPC 服 务 器 过 程 


A.4 消息 传递 延迟 程序 


bench/bw_sunrpc_server.c 


本 节 给 出 测量 管道 、Posix 消 恩 队 列 、System V 消 息 队 列 、 门 和 Sun 
RPC 的 延迟 的 各 个 程序 。 图 A-1 给 出 了 它们 的 性 能 值 。 

A.4.1 管道 延迟 程序 

图 A-29 给 出 了 测量 一 个 管道 的 延迟 的 程序 。 





bench/lat_pipe.c 





1 #include "unpipc.h" 
2 void 
3 doit(int readfd, int writefd) 
4 { 
5 char cs 
6 Write(writefd, &c, 1); 
y if (Read(readfd, &c, 1) != 1) 
8 err quit("read error"); 
3 
10 int 
11 main(int argc, char **argv) 
12 .( 
13 int i, nloop, pipel[2], pipe2[2]; 
14 char CF 
15 pid t childpid; 
16 if (argG !- 2) 
T err quit("usage: lat pipe <#loops>") ; 
18 nloop - atoi(argv[1]); 
19 Pipe (pipel) ; 
20 Pipe (pipe2) ; 
21 if ( (childpid = Fork()) == 0) { 
22 fof ( Guy /* child */ 
23 if (Read(pipel[0], &c, 1) != 1) 
24 err quit("read error"); 
25 Write(pipe2[1], &c, 1); 
26 ) 
27 exit (0); 
28 } 
29 /* parent */ 
30 doit (pipe2[0], pipel[1]); 
31 Start time(); 
32 for (i = 0; i « nloop; i++) 
33 doit (pipe2[0], pipel[1]); 
34 printf ("latency: $.3f usec\n", Stop time() / nloop); 
35 Kill(childpid, SIGTERM) ; 
36 exit (0); 
37 } 
bench/lat pipe.c 
图 A-29 测量 一 个 管道 的 延迟 的 程序 
doit K Zi 


2~9 ”本 函数 在 父 进程 中 运行 ， 它 所 花 的 时 钟 时 间 将 被 测量 出 来 。 
它 往 一 个 管道 写 入 1 个 字 节 该 字 节 将 由 子 进程 读 出 后 从 为 一 个 管道 
读 出 1 个 字 节 该 字 节 由 子 进程 写 入 〉 。 这 就 是 我 们 所 描述 的 延迟 : 从 
发 送 一 个 小 消 妃 到 接收 作为 应 答 的 一 个 小 消息 所 人 花 的 时 间 。 


创建 管道 

19~20 创建 两 个 管道 ，fork 一 个 子 进程 ， 形 成 图 4-6 所 示 的 布局 
(不 过 没有 关闭 每 个 管道 的 未 用 端 ， 这 是 不 会 有 问题 的 ) 。 本 测试 程序 
确实 需要 两 个 管道 ， 因 为 管道 是 半 双 工 的 ， 而 我 们 希望 父子 进程 间 有 双 
向 通信 。 

子 进 程 回 射 只 有 1 个 字 节 的 消息 

22—27 子 进 程 执行 一 个 无 限 循 环 ， 每 次 读 出 一 个 只 有 1 个 字 节 的 消 
息 后 就 把 它 发 射 回 来 。 

测量 父 进程 

29—34 ” 父 进 程 首先 调用 doit 给 子 进程 发 送 一 个 只 有 1 个 字 市 的 消 
息 ， 并 读 出 它 的 也 是 只 有 1 个 字 节 的 应 答 。 这 使 得 两 个 进程 都 处 于 运行 
状态 。 父 进程 然后 在 一 个 循环 中 调用 doit 函 数 ， 同 时 测量 所 花 的 时 钟 时 
间 。 

在 运行 Solaris 2.6 的 一 人 台 Sparc 主 机 上 接连 运行 该 程序 5 次 ， 得 到 如 下 


+ 
结果 : 



































solaris % lat_pipe 10000 

latency: 278.633 usec 

solaris % lat_pipe 10000 

latency: 397.810 usec 

solaris % lat_pipe 10000 

latency: 392.567 usec 

solaris % lat_pipe 10000 

latency: 266.572 usec 

solaris % lat_pipe 10000 

latency: 284.559 usec 

这 5 次 程序 运行 的 平均 值 为 324 微 秒 ， 它 就 是 图 A-1 中 给 出 的 值 。 这 

些 时 间 包 括 两 次 上 下 文 切换 (从 父 进 程 到 子 进程 ， 然 后 是 从 子 进程 到 父 





进程 ) 、 四 个 系统 调用 〈 父 进程 的 write、 子 进程 的 read、 子 进程 的 





write、 父 进程 的 read) 以 及 每 个 方 同 1 字 节 数据 的 管道 开销 。 
A.4.2 Posix 消 息 队 列 延 迟 程序 
图 A-30 给 出 了 一 个 Posix 消 息 队 列 延 迟 测 量程 序 。 





1 #include "unpipc.h" 

2 #define NAME1 . "lat pxmsgl" 

3 #define NAME2 "lat pxmsg2" 

4 #define MAXMSG 4 /* room for 4096 bytes on queue */ 
5 #define MSGSIZE 1024 


6 void 

7 doit (mqd t mqsend, mgd t mqgrecv) 
8 

9 


char buff [MSGSIZE] ; 


10 Mq_send(mqsend, buff, 1, 0); 

11 if (Mq receive(mqrecv, buff, MSGSIZE, NULL) !- 1) 
12 err quit("mq receive error"); 

13 } 

14 int 

15 main(int argc, char **argv) 

16 ( 

7 int i, nloop; 

18 mqd_t mql, mq2; 

19 char buff [MSGSIZE] ; 


bench/lat pxmsg.c 





图 A-30 一 个 Posix 消 息 队 列 延 迟 测 量程 序 





20 pidt  childpid; 


21 struct mq attr attr; 

22 If {arge l= 2) 

23 err quit ("usage: lat pxmsg <#loops>") ; 

24 nloop = atoi(argv[1]); 

25 attr.mq_maxmsg = MAXMSG; 

26 attr.mq_msgsize = MSGSIZE; 

27, mql = Mq open(Px ipc name(NAME1), O_RDWR | O CREAT, FILE MODE, &attr); 
28 mq2 - Mq open(Px ipc name(NAME2), O RDWR | O CREAT, FILE MODE, &attr); 
29 if ( (childpid = Fork()) == 0) ( 

30 for suni /* child */ 

32 if (Mq_receive(mql, buff, MSGSIZE, NULL) !- 1) 
32 err quit("mq receive error"); 

33 Mq send(mq2, buff, 1, 0); 

34 } 

35 exit (0) ; 

36 } 

37 /* parent */ 

38 doit (mql, mq2) ; 

39 Start time(); 

40 for (i = 0; i < nloop; i++) 

41 doit (mql, mq2) ; 

42 printf ("latency: $.3f usec\n", Stop time() / nloop); 
43 Kill(childpid, SIGTERM) ; 

44 Mq close (mq1); 

45 Mq close (mq2) ; 

46 Mq unlink(Px ipc name (NAME1) ) ; 

47 Mq unlink(Px ipc name (NAME2) ) ; 

48 exit (0); 

49 } 





bench/lat pxmsg.c 
BIA-30 CH) 


25—28 ”创建 两 个 消息 队列 ， 一 个 用 于 从 父 进程 到 子 进程 的 消息 传 
递 ， 男 一 个 用 于 从 子 进程 到 父 进程 的 消息 传递 。 尽 管 Posix 消 息 具 有 优 
先 级 ， 从 而 允许 我 们 给 两 个 不 同方 向 的 消息 赋 不 同 的 优先 级 ， 
md_receive 却 总 是 返回 队列 中 的 下 一 个 消息 。 因 此 ， 我 们 不 能 仅 给 本 测 
试 程序 使 用 一 个 队列 。 

A.4.3 System V 消 息 队 列 延 迟 程序 

图 A-31 给 出 了 一 个 System V 消 息 队 列 延 迟 测量 程序 。 

本 程序 只 创建 一 个 消息 队列 ， 它 含有 两 个 不 同方 向 的 消息 : 从 父 进 
程 到 子 进程 和 从 子 进程 





到 父 进程 。 前 者 的 类 型 字段 为 1， 后 者 的 类 型 字段 为 2。doit 中 
msgrcv 的 第 四 个 参数 为 2， 子 进程 中 msgrcv 的 第 四 个 参数 为 1， 它 们 都 只 
读 出 所 指定 类 型 的 消息 。 

在 9.3 节 和 11.3 节 中 我 们 提 到 过 ， 许 多 由 内 核定 义 的 结构 不 能 静态 地 
初始 化 ， 因 为 Posix.1 和 Unix 98 只 保证 在 这 样 的 结构 中 存在 特定 的 成 
员 。 这 两 个 标准 不 保证 这 些 成 员 的 顺序 ， 更 何况 这 样 的 结构 还 可 以 含有 
其 他 的 非 标准 成 员 。 然 而 在 本 程序 中 我 们 还 是 静态 地 初始 化 msgbuf 结 
构 ， 因 为 System ”YYV 消 息 列 保证 该 结构 含有 一 个 long 类 型 的 消息 类 型 成 
员 ， 后 跟 真 正 的 数据 。 
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#include "unpipc.h" 
struct msgbuf p2child = { 1, (0) }; /* type = 1 */ 
struct msgbuf child2p = { 2, { 0 } }; /* type = 2 */ 


struct msgbuf inbuf ; 


void 
doit (int msgid) 
{ 
Msgsnd(msgid, &p2child, 0, 0); 
if (Msgrcv(msgid, &inbuf, sizeof(inbuf.mtext), 2, 0) != 0) 
err quit("msgrcv error"); 


) 


int 
main(int argc, char **argv) 
( 
int i, nloop, msgid; 
pid t childpid; 


if (arge t= 2) 
err quit("usage: lat svmsg <#loops>") ; 
nloop = atoi(argv[11); 


msgid - Msgget(IPC PRIVATE, IPC CREAT | SVMSG MODE); 


if ( (childpid - Fork()) -- O) ( 
fom ug /* child */ 
if (Msgrcv(msgid, &inbuf, sizeof(inbuf.mtext), 1, 0) ! 
err quit("msgrcv error"); 
Msgsnd(msgid, &child2p, 0, 0); 


M 
o 


) 


exit (0); 
) 

/* parent */ 
doit (msgid); 


Start time(); 
for (i = 0; i « nloop; i++) 
doit (msgid); 
printf("latency: $.3f usec\n", Stop time() / nloop); 


Kill(childpid, SIGTERM); 
Msgctl(msgid, IPC RMID, NULL); 
exit (0); 


) 








图 A-31 一 个 System V 消 息 队 列 延 迟 测量 程序 


m 











A.4.4 门 延迟 程序 

图 A-32 给 出 了 门 API 的 延迟 测量 程序 。 子 进程 创建 其 中 的 门 ， 然 后 
给 该 门 关联 以 server 函 数 。 父 进程 接着 打开 该 门 ， 并 在 一 个 循环 中 激活 
door_call。 作 为 参数 传递 的 是 1 个 字 节 的 数据 ， 返 回 值 则 不 存在 。 


bench/lat_svmsg.c 


bench/lat svmsg.c 





1 #include "unpipc.h" 
2 void 
3 server(void *cookie, char *argp, size t arg size, 
4 door desc t *dp, size t n descriptors) 
E 
6 char e; 
7 Door return(&c, sizeof(char), NULL, 0); 
8 } 
9 int 
10 main(int argc, char **argv) 
11 { 
I2 int i, nloop, doorfd, contpipe[2]; 
13 char es 
14 pidt  childpid; 
15 door arg t arg; 
16 if (argc != 3) 
Ly err quit ("usage: lat door <pathname> <#loops>") ; 
18 nloop = atoi(argv[2]) ; 
19 unlink (argv [1]) ; 
20 Close (Open (argv [1], O CREAT | O EXCL | O_RDWR, FILE MODE)); 
21 Pipe (contpipe) ; 
22 if ( (childpid = Fork()) == 0) { 
23 doorfd = Door create(server, NULL, 0); 
24 Fattach(doorfd, argv[1]); 
25 Write (contpipe[1], &c, 1); 
26 for (;; ) /* child = server */ 
27 pause () ; 
28 exit (0); 
29 ) 
30 arg.data ptr - &c; /* parent - client */ 
31 arg.data size = sizeof (char); 
32 arg.desc ptr - NULL; 
33 arg.desc num - 0; 
34 arg.rbuf - &c; 
35 arg.rsize - sizeof (char); 
36 if (Read(contpipe[0], &c, 1) != 1) /* wait for child to create */ 
37 err quit("pipe read error"); 
38 doorfd = Open(argv[1], O RDWR); 
39 Door call(doorfd, &arg); /* once to start everything */ 
40 Start time(); 
41 for (i = 0; i « nloop; i++) 
42 Door_call(doorfd, &arg) ; 
43 printf ("latency: $.3f usec\n", Stop time() / nloop); 
44 Kill (childpid, SIGTERM) ; 
45 unlink (argv [1]) ; 
46 exit (0) ; 
47 } 





bench/lat door.c 


bench/lat door.c 


图 A-32 门 API 的 延迟 测量 程序 

A.4.5 Sun RPC 延 迟 程序 

为 测量 Sun RPC API 的 延 人 运 ， 我 们 编写 一 个 客户 和 一 个 服务 器 两 个 
程序 (类 似 于 测量 Sun ”RPC 带宽 的 做 法 ) 。 我 们 使 用 同样 的 RPC 说 明 书 
文件 (图 A-26) ， 不 过 这 次 我 们 的 客户 程序 调用 空 过 程 。 回 想 习 题 
16.11， 我 们 知道 该 过 程 没有 参数 ， 也 没有 返回 值 ， 而 这 正好 是 测量 延 
迟 所 需 的 。 图 A-33 给 出 了 客户 程序 。 跟 习题 16.11 的 解答 一 样 ， 我 们 必 
须 通过 直接 调用 clnt_call 来 调用 空 过 程 ， 在 客户 程序 存根 中 不 提供 它 的 
存根 函数 。 











bench/lat_sunrpc_client.c 


1 #include "unpipc.h" 
2 #include "lat sunrpc.h" 
3 int 


4 main(int argc, char **argv) 


6 int i, nloop; 

7 CLIENT *cl; 

8 struct timeval tv; 

9 if (arge != 4) 

10 err quit ("usage: lat sunrpc client «hostname» <#loops> <protocol>") ; 
11 nloop = atoi(argv[2]) ; 

12 cl = Clnt create(argv[1], BW SUNRPC PROG, BW SUNRPC VERS, argv[3]); 
13 tv.tv sec - 10; 

14 tv.tv usec - 0; 

15 Start time(); 

16 for (i = 0; i « nloop; i++) { 

17 if (clnt call(cl, NULLPROC, xdr void, NULL, 

18 xdr void, NULL, tv) !- RPC SUCCESS) 

19 err quit("$s", clnt sperror(cl, argv[1])); 
20 } 
2T printf("latency: $.3f usec\n", Stop time() / nloop); 
22 exit (0); 
23 } 





bench/lat sunrpc client.c 
图 A-33 测量 Sun RPC 延 迟 的 Sun RPC 客 户 程序 
我 们 使 用 图 A-28 中 的 服务 器 函数 编译 出 服务 器 程序 ， 不 过 该 函数 从 
来 不 被 调用 。 既 然 是 使 用 rpcgen 来 构造 客户 程序 和 服务 器 程序 的 ， 那 么 
我 们 需要 定义 至 少 一 个 服务 器 过 程 ， 但 是 可 不 调用 它 。 使 用 rpcgen 的 原 














因 在 于 它 自 动产 生 带 空 过 程 的 服务 器 程序 的 main 函 数 ， 而 我 们 正 需 要 这 
些 。 

A.5 线程 同步 程序 

为 测量 各 种 同步 技术 所 需 的 时 间 ， 我 们 创建 一 定数 目的 线程 (图 A- 
6 和 图 A-8 给 出 的 测量 结果 使 用 1 个 到 5 个 线程 》， 每 个 线程 给 处 于 共享 内 
存 区 中 的 一 个 计数 器 加 1 很 多 次 (一 个 很 大 的 次 数 ) ， 各 线程 使 用 相应 
于 当前 测量 的 同步 形式 来 协调 对 于 该 共享 计数 器 的 访问 。 

A.5.1 Posix 互 斥 锁 程 序 

图 A-34 给 出 了 Posix 互 斥 锁 测 量程 序 的 全 局 变量 和 main 函 数 。 


bench/incr pxmutex1.c 





1 #include "unpipc.h" 
2 #define MAXNTHREADS 100 
3. dnb nloop; 


4 struct ( 

5 pthread mutex t mutex; 
6 long counter; 

7 ) shared = { 

8 PTHREAD MUTEX INITIALIZER 
9 


lm 


10 void *incr(void *); 

Il. FHE 

12 main(int argc, char **argv) 

Is: d 

14 int i, nthreads; 

15 pthread t tid [MAXNTHREADS] ; 

16 if (atge != 3) 

17 err quit("usage: incr pxmutex1 <#loops> <#threads>") ; 
18 nloop - atoi(argv[1]); 

19 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 

20 /* lock the mutex */ 

21 Pthread mutex lock(&shared.mutex); 

22 /* create all the threads */ 

23 Set concurrency (nthreads) ; 

24 for (i = 0; i < nthreads; i++) { 

25 Pthread create(&tid[i], NULL, incr, NULL); 

26 } 

27 /* start the timer and unlock the mutex */ 

28 Start time(); 

29 Pthread mutex unlock (&shared.mutex); 

30 /* wait for all the threads */ 

31 for (i = 0; i « nthreads; i++) { 

32 Pthread join(tid[i], NULL); 

33 ) 

34 printf("microseconds: $.0f usec\n", Stop time()); 
35 if (shared.counter !- nloop * nthreads) 

36 printf("error: counter = %ld\n", shared.counter) ; 
37 exit (0) ; 

38 } 





bench/incr_pxmutex1.c 








图 A-34 测量 Posix 互 斥 锁 
共享 的 数据 
4—9 ”各 线程 间 共 享 的 数据 由 互 斥 锁 本 身 和 计数 器 构成 。 该 互 斥 锁 
是 静态 初始 化 的 。 





司 步 的 全 局 变量 和 main 函 数 


给 互 斥 锁 上 锁 并 创建 线程 

20—26 “主线 程 在 创建 其 他 线程 前 给 共享 数据 的 互 斥 锁 上 锁 ， 这 样 
在 所 有 线程 都 创建 出 来 并 且 主 线程 释放 该 互 斥 锁 之 前 ， 没 有 一 个 线程 能 
够 获取 该 互 斥 锁 。 主 线程 接着 调用 我 们 的 set_concurrency 函 数 ， 并 创建 
出 各 个 线程 。 每 个 线程 执行 接 下 来 给 出 的 incr 疯 数 。 

局 动 定 时 局 并 释放 互 斥 锁 

27—36 ”一 旦 所 有 线程 都 已 创建 ， 主 线程 就 启动 定时 占 并 释放 互 斥 
锁 。 它 接 下 去 等 待 所 有 线程 结束 ， 到 时 候 就 停止 定时 器 ， 输 出 所 计 的 总 
微 秒 数 。 

图 A-35 给 出 了 每 个 线程 执行 的 incr 函 数 。 








bench/incr_pxmutex1.c 





39 void * 

40 incr(void *arg) 

41 ( 

42 int i; 

43 for (i = 0; i < nloop; i++) { 

44 Pthread_mutex_lock (&shared.mutex) ; 
45 shared. counter++; 

46 Pthread_mutex_unlock (&shared.mutex) ; 
47 

48 return (NULL) ; 

49 } 


bench/incr_pxmutex1.c 














图 A-35 使 用 一 个 Posix 互 斥 锁 给 一 个 共享 的 计数 器 加 1 

在 临界 区 中 给 计数 器 加 1 

44—46 获取 共享 数据 的 互 斥 锁 后 给 共享 的 计数 器 加 1。 接 看 释放 该 
ARAL. 

A.5.2 该 写 锁 程序 

使 用 读 写 锁 的 程序 由 刚才 使 用 Posix 互 斥 锁 的 程序 稍 加 修改 而 成 。 
每 个 线程 在 给 共享 的 计数 器 加 1 前 必须 获取 该 计数 器 读 写 锁 中 的 写 入 
锁 。 

实现 第 8 章 中 讲述 的 Posix 读 写 锁 的 系统 并 不 多 ，Posix 读 写 锁 是 Unix 
98 的 一 部 分 内 容 ， ”Posix.1j 工 作 组 目前 正在 考虑 它 的 标准 化 。 本 附录 中 














给 出 的 读 写 锁 测量 结果 是 在 Solaris 2.6 下 做 出 的 ， 它 使 用 在 rwlock(3T) 手 
册页 面 中 描述 的 Solaris 读 写 锁 。 该 实现 提供 了 与 提议 中 的 读 写 锁 同 样 的 
功能 ， 以 我 们 在 第 8 章 中 给 出 的 函数 为 接口 来 使 用 这 些 函 数 所 需要 的 包 
里 函数 非常 简单 。 

Digital Unix 4.0B 下 的 测量 结果 是 使 用 Digital 的 线程 无 关 服 务 读 写 锁 
做 出 的 ， 这 种 读 写 锁 在 tis_rwlock 手 册页 面 中 描述 。 我 们 不 再 给 出 为 这 
些 读 写 锁 对 图 A-36 和 图 A-37 进 行 的 简单 修改 。 

图 A-36 给 出 了 main 函 数 ， 图 A-37 给 出 了 incr 函 数 。 





bench/incr. rwlockl.c 
1 #include "unpipc.h" 
2 #include <synch.h> /* Solaris header */ 


3 void Rw wrlock(rwlock t *rwptr) ; 
4 void Rw unlock(rwlock t *rwptr); 


5 #define MAXNTHREADS 100 


6 int nloop; 

7 struct ( 

8 rwlock t rwlock; /* the Solaris datatype */ 

9 long counter; 

10 } shared; /* init to 0 -> USYNC_THREAD */ 








图 A-36 读 写 锁 同 步 测 量程 序 的 main 函 数 














11 void *incr (void *); 








I2. Ine 

13 main(int argc, char **argv) 

14 ( 

15 int i, nthreads; 

16 pthread t tid [MAXNTHREADS] ; 

17 if (arge lg 3) 

18 err quit("usage: incr rwlockl <#loops> <#threads>") ; 

19 nloop = atoi (argv[1]); 

20 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 

21 /* obtain write lock */ 

22 Rw wrlock(&shared.rwlock); 

23 /* create all the threads */ 

24 Set concurrency (nthreads) ; 

25 for (i = 0; i < nthreads; i++) { 

26 Pthread_create(&tid[i], NULL, incr, NULL); 

2d } 

28 /* start the timer and release the write lock */ 

29 Start time(); 

30 Rw unlock (&shared.rwlock); 

31 /* wait for all the threads */ 

32 for (i = 0; i < nthreads; i++) { 

33 Pthread join(tid[i], NULL); 

34 } 

35 printf ("microseconds: $.0f usec\n", Stop time()); 

36 if (shared.counter != nloop * nthreads) 

37 printf ("error: counter = %ld\n", shared.counter) ; 

38 exit (0); 

39 } 
bench/incr. rwlockl.c 

图 A-36 (5D 

bench/incr_rwlock1.c 

40 void * 

41 incr(void *arg) 

42 { 

43 int i; 

44 for (i = 0; i < nloop; i++) { 

45 Rw_wrlock (&shared.rwlock) ; 

46 shared.counter++; 

47 Rw_unlock (&shared.rwlock) ; 

48 } 

49 return (NULL) ; 

50 } 





bench/incr. rwlockl.c 





图 A-37 使 用 一 个 读 写 锁 给 一 个 共享 的 计数 器 加 1 


A.5.3 Posix 基 于 内 存 的 信号 量程 序 
我 们 既 测量 Posix 基 于 内 存 的 信号 量 ， 也 测量 Posix 有 名 信号 量 。 图 








A-39 给 出 了 基于 内 存 的 信号 量 的 测量 程序 的 main 函 数 ， 图 A-38 给 出 了 它 
的 incr 函 数 。 





bench/incr pxseml.c 


void * 
incr(void *arg) 
{ 
int i; 
for (i = 0; i « nloop; i++) { 
Sem wait (&shared.mutex) ; 
shared. counter++; 
Sem_post (&shared.mutex) ; 
} 
return (NULL) ; 
} 





bench/incr pxseml.c 


图 A-38 使 用 一 个 Posix 基 于 内 存 的 信号 量 给 一 个 共享 的 计数 器 加 1 

















1 #include "unpipc.h" 

2 #define MAXNTHREADS 100 

3 int nloop; 

4 struct ( 

5 sem t mutex; /* the memory-based semaphore */ 
6 long counter; 

7 ) shared; 

8 void *incr(void *); 

9 int 

10 main(int argc, char **argv) 

zn if 

12 int i, nthreads; 

13 pthread t tid [MAXNTHREADS] ; 

14 if (argc != 3) 

15 err quit("usage: incr_pxseml <#loops> <#threads>") ; 
16 nloop = atoi(argv[1]) ; 

17 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 

18 /* initialize memory-based semaphore to 0 */ 

19 Sem_init (&shared.mutex, 0, 0); 

20 /* create all the threads */ 

ZT Set_concurrency (nthreads) ; 

22 for (i = 0; i < nthreads; i++) { 

23 Pthread create(&tid[i], NULL, incr, NULL); 

24 ) 

25 /* start the timer and release the semaphore */ 
26 Start time(); 

27 Sem post (&shared.mutex) ; 

28 /* wait for all the threads */ 

29 for (i = 0; i « nthreads; i++) { 

30 Pthread_join(tid[i], NULL) ; 

31 } 

32 printf ("microseconds: %.0f usec\n", Stop time()) 

33 if (shared.counter !- nloop * nthreads) 

34 printf("error: counter = %ld\n", shared.counter) ; 
35 exit (0); 

36 } 














图 A-39 Posix 基 于 内 存 信号 量 的 同步 的 测量 程序 的 main 函 数 





18~19 创建 一 个 值 为 0 的 信号 量 ， 而 把 给 sem_init 的 第 
为 0 表明 所 创建 的 信号 量 将 在 调用 进程 的 各 个 线程 间 共 享 。 





bench/incr pxseml.c 


bench/incr pxseml.c 


二 个 参数 指定 


20—27 创建 出 所 有 的 线程 后 ， 主 线程 启动 定时 器 并 调用 sem_post 一 


次 。 








A.5.4 Posix 有 名 信号 量程 序 








图 A-41 给 出 了 Posix 有 名 信号 量 测量 程序 的 main 函 数 ， 图 A-40 给 出 


了 它 的 ipcr 函 数 。 





bench/incr_pxsem2.c 


40 void * 

41 incr(void *arg) 

42 ( 

43 int i; 

44 for (i = 0; i « nloop; i++) { 
45 Sem_wait (shared.mutex) ; 
46 shared. counter++; 

47 Sem_post (shared.mutex) ; 
48 } 

49 return (NULL) ; 

50 } 





bench/incr_pxsem2.c 








图 A-40 Posix 有 名 信和 号 量 的 同步 的 测量 程序 的 main 函 数 


bench/incr_pxsem2.c 


1 #include "unpipc.h" 
2 #define MAXNTHREADS 100 
3 #define NAME "incr pxsem2" 
4 int nloop; 
5 struct { 
6 sem_t *mutex; /* pointer to the named semaphore */ 
7 long counter; 
8 } shared; 
9 void *incr(void *) ; 
10 int 
11 main(int argc, char **argv) 
12 { 
LS int i, nthreads; 
14 pthread_t tid [MAXNTHREADS] ; 
15 if (arge != 3) 
16 err quit ("usage: incr pxsem2 <#loops> <#threads>") ; 
17 nloop = atoi(argv[11); 
18 nthreads - min(atoi(argv[2]), MAXNTHREADS); 
19 /* initialize named semaphore to 0 */ 
20 sem unlink(Px ipc name (NAME)); /* error OK */ 
21 shared.mutex = Sem open(Px ipc name(NAME), O CREAT | O EXCL, FILE MODE,0); 
22 /* create all the threads */ 
23 Set concurrency (nthreads) ; 
24 for (i = 0; i < nthreads; i++) { 
25 Pthread_create(&tid[i], NULL, incr, NULL); 
26 } 
27 /* start the timer and release the semaphore */ 











图 A-41 使 用 一 个 Posix 有 名 信号 量 给 一 个 共享 的 计数 器 加 1 





28 Start time(); 

29 Sem post (shared.mutex) ; 

30 /* wait for all the threads */ 

31 for (i = 0; i < nthreads; i++) { 

32 Pthread join(tid[i], NULL); 

33 ) 

34 printf("microseconds: $.0f usec\n", Stop time()); 
35 if (shared.counter !- nloop * nthreads) 

36 printf("error: counter = %ld\n", shared.counter); 
37 Sem unlink(Px ipc name (NAME) ) ; 

38 exit (0); 

39 } 





图 A-41 CH 


A.5.5 System V 信 号 量程 序 


bench/incr_pxsem2.c 








图 A-42 给 出 了 System V 信 号 量 测 量程 序 的 main 函 数 ， 图 A-43 给 出 它 
的 incr 函 数 。 





#include "unpipc.h" 


#define MAXNTHREADS 100 


int nloop; 


struct { 
int semid; 
long counter; 
} shared; 


struct sembuf postop, waitop; 


void *incr(void *); 


int 


main(int argc, char **argv) 


{ 


int i, nthreads; 
pthread_t tid [MAXNTHREADS] ; 
union semun arg; 


if (arge f= 3) 


err quit ("usage: incr svseml <#loops> <#threads>") ; 


nloop = atoi(argv[1]) ; 


nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 


/* create semaphore and initialize to 0 */ 


shared.semid = Semget(IPC PRIVATE, 1, IPC CREAT | SVSEM MODE); 


arg.val - 0; 


Semctl(shared.semid, 0, SETVAL, arg); 


postop.sem num 
postop.sem op 
postop.sem flg 
waitop.sem num 
waitop.sem op 
waitop.sem flg 


0; 


/* and init the two semop() structures */ 


图 A-42 测量 System V 信 和 号 量 


的 同步 的 程序 的 main 函 数 


bench/incr svseml.c 





30 /* create all the threads */ 








31 Set_concurrency (nthreads) ; 
32 for (i = 0; i < nthreads; i++) { 
33 Pthread create (&tid[i], NULL, incr, NULL); 
34 } 
35 /* start the timer and release the semaphore */ 
36 Start time(); 
37 Semop(shared.semid, &postop, 1); /* up by 1 */ 
38 /* wait for all the threads */ 
39 for (i = 0; i < nthreads; i++) { 
40 Pthread join(tid[il, NULL); 
41 } 
42 printf ("microseconds: $.0f usec\n", Stop time()); 
43 if (shared.counter != nloop * nthreads) 
44 printf ("error: counter = %ld\n", shared.counter) ; 
45 Semctl(shared.semid, 0, IPC RMID); 
46 exit (0); 
47 ) 
bench/incr svseml.c 
图 A-42 CH 
bench/incr svseml.c 
48 void * 
49 incr(void *arg) 
50 ( 
51 int i; 
52 for (i = 0; i « nloop; i++) { 
53 Semop(shared.semid, &waitop, 1); 
54 shared. counter++; 
55 Semop(shared.semid, &postop, 1); 
56 ) 
57 return (NULL) ; 
58 ) 





0. 


bench/incr_svsem1.c 











图 A-43 使 用 一 个 System V 信 号 量 给 一 个 共享 的 计数 器 加 1 


20—23 ”创建 一 个 仅 有 一 个 成 员 的 信号 量 集 ， 并 把 它 的 值 初 始 化 为 


24—29 初始 化 两 个 semop 结 构 ， 一 个 用 于 挂 出 该 信和 号 量 ， 力 一 个 用 


于 等 待 该 信号 量 。 注 意 这 两 个 结构 的 sem_flg 成 员 均 为 0， 也 就 是 说 没有 
指定 SEM_UNDO 标 志 。 


A.5.6 带 SEM_UNDO 特 性 的 System V 信 号 量程 序 
测量 具有 SEM_UNDO 特 性 的 System ”V 信 号 量 的 程序 与 图 A-42 相 比 


的 唯一 差别 是 : 它 把 两 个 semop 结 构 的 sem_flg 成 员 设置 成 SEM_UNDO 


而 不 是 0。 我 们 不 再 给 出 这 个 简单 修改 后 的 版 本 。 

A.5.7 fcntl 记 录 上 锁 程 序 

最 后 一 个 程序 使 用 fcntl 记 录 上 锁 提供 同步 。 图 A-45 给 出 了 它 的 main 
函数 。 该 程序 只 在 指定 单个 线程 时 才 会 成 功 地 运行 ， 因 为 fcnt 锁 是 在 不 
同 进 程 间 而 不 是 单个 进程 的 不 同 线程 间 共 享 的 。 当 指定 多 个 线程 时 ， 
个 线程 总 能 获取 所 请 求 的 锁 ( 也 就 是 说 writew_lock 调 用 从 不 阻塞， 因为 
调用 进程 早已 拥有 该 锁 ) ， 因 而 计数 器 的 最 终 值 是 错误 的 。 

18~22 ” 待 创 建 并 随后 用 于 上 锁 的 文件 的 路 径 名 是 作为 一 个 命令 行 
参数 指定 的 。 这 样 允 许 我 们 就 驻 留 在 不 同文 件 系统 上 的 文件 测量 这 个 程 
序 。 我 们 预期 当 该 文件 处 在 某 个 通过 NFS 安 装 的 文件 系统 上 时 ， 该 程序 
的 运行 变 慢 ， 这 种 情况 要 求 两 个 系统 “NFS 客户 主机 和 NFS 服 务 器 主 
NL) 都 支持 NFS 记 录 上 锁 。 

图 A-44 给 出 了 使 用 记录 上 锁 的 incr 函 数 。 








bench/incr_fentll.c 





44 void * 

45 incr(void *arg) 

46 ( 

47 int d 

48 for (i = 0; i « nloop; i++) { 

49 Writew lock(shared.fd, 0, SEEK SET, 0); 
50 shared. counter++; 

51 Un_lock(shared.fd, 0, SEEK_SET, 0); 
52 

53 return (NULL) ; 

54 } 


bench/incr_fentll.c 























图 A-44 使 用 fentl 记 录 上 锁 给 一 个 共享 的 计数 器 加 1 





bench/incr_fentll.c 
4 #include "unpipc.h" 


5 #define MAXNTHREADS 100 





6 int nloop; 

7 struct ( 

8 int fd; 

9 long counter; 

10 } shared; 

11 void *incr (void *); 

12. int 

13 main(int argc, char **argv) 

14 ( 

15 int i, nthreads; 
16 char *pathname; 
17 pthread t tid [MAXNTHREADS] ; 
18 if (argc != 4) 
19 err quit ("usage: incr fcnt11 <pathname> <#loops> <#threads>") ; 
20 pathname = argv[1]; 
21 nloop = atoi(argv[2]) ; 
22 nthreads = min(atoi(argv[3]), MAXNTHREADS) ; 
23 /* create the file and obtain write lock */ 
24 shared.fd = Open (pathname, O_RDWR | O CREAT | O TRUNC, FILE MODE); 
25 Writew lock(shared.fd, 0, SEEK SET, 0); 
26 /* create all the threads */ 
27 Set concurrency (nthreads); 
28 for (i = 0; i « nthreads; i++) { 
29 Pthread create(&tid[i], NULL, incr, NULL); 
30 } 
31 /* start the timer and release the write lock */ 
32 Start time(); 

图 A-45 fcntl 记 录 上 锁 测 量程 序 的 main 函 数 

33 Un lock(shared.fd, 0, SEEK SET, 0); 

34 /* wait for all the threads */ 

35 for (i = 0; i < nthreads; i++) { 

36 Pthread_join(tid[i], NULL) ; 

37 } 

38 printf ("microseconds: %.0f usec\n", Stop time()); 

39 if (shared.counter != nloop * nthreads) 

40 printf ("error: counter = %ld\n", shared.counter) ; 
41 Unlink (pathname) ; 

42 exit (0) ; 

43 } 


bench/incr_fentll.c 
图 A-45〈 续 ) 


A.6 进程 同步 程序 


上 一 节 给 出 的 程序 中 ， 多 个 线程 间 共 享 一 个 计数 右 比 较 简单 : 我 们 
只 需 把 该 计数 器 作为 一 个 全 局 变量 存放 。 我 们 现在 修改 这 些 程序 以 提供 
不 同 进程 间 的 同步 。 

为 在 一 个 父 进程 和 它 的 各 个 子 进 程 间 共享 该 计数 锅 ， 我 们 把 它 存 放 
在 由 图 A-46 给 出 的 my_shm 函 数 分 配 的 共享 内 存 区 中 。 














lib/my_shm.c 
1 #include "unpipc.h" 
2 void * 
3 my shm(size t nbytes) 
41 
5 void *shared; 
6 dif defined(MAP ANON) 
vi shared - mmap(NULL, nbytes, PROT READ | PROT WRITE, 
8 MAP ANON | MAP SHARED, -1, 0); 
9 #elif defined (HAVE DEV ZERO) 
10 int fd; 
11 /* memory map /dev/zero */ 
12 if ( (fd = open("/dev/zero", O RDWR)) == -1) 
13 return(MAP FAILED); 
14 shared - mmap(NULL, nbytes, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
15 close (fd); 
16 4 else 
17 # error cannot determine what type of anonymous shared memory to use 
18 # endif 
19 return (shared) ; /* MAP FAILED on error */ 
20 } 
lib/my_shm.c 

















图 A-46 给 一 个 父 进程 和 它 的 各 个 子 进 程 创 建 一 个 共享 内 存 区 


如 果 系 统 支 持 MAP_ANON 标 志 12.445) ， 我 们 就 使 用 它 ， 否 则 
我 们 把 /dev/zero 〈12.5 节 ) 映射 到 内 存 。 

进一步 的 修改 依赖 于 同步 类 型 以 及 调用 fork 时 底层 支撑 数据 类 型 发 
生 的 变化 。 我 们 已 在 10.12 节 讲述 过 其 中 一 些 细节 。 

Posix 互 斥 锁 : 互 斥 锁 必须 存放 在 共享 内 存 区 中 〔( 跟 共享 的 计数 器 
在 一 起 ) ， 而 且 初 始 化 互 斥 锁 时 必须 设置 
PTHREAD_PROCESS_SHARED 属 性 。 我 们 稍 后 给 出 这 个 程序 的 代码 。 

Posix 读 写 锁 : 读 写 锁 必 须 存放 在 共享 内 存 区 中 ( 跟 共享 的 计数 器 








在 一 起 ) ， 而 且 初 始 化 读 写 锁 时 必须 设置 
PTHREAD_PROCESS_SHARED 属 性 。 

Posix 基 于 内 存 的 信号 量 : 信和 号 量 必 须 存 放 在 共享 内 存 区 中 〈 跟 共 
享 的 计数 器 在 一 起 ) ， 而 且 sem_init 的 第 二 个 参数 必须 为 1， 从 而 指定 该 
言 号 量 是 在 进程 间 共 享 的 。 

Posix 有 名 信号 量 : 我 们 既 可 以 让 父 进程 和 每 个 子 进程 都 调用 
sem_open， 也 可 以 只 让 父 进程 调用 sem_open， 因 为 我 们 知道 该 信号 量 将 
通过 fork 由 子 进程 共享 。 

System V 信 号 量 : 不 必 编 写 任何 特殊 的 代码 ， 因 为 这 种 信号 量 总 是 
能 够 在 进程 间 共 享 。 子 进程 只 需 知 道 父 进程 所 创建 信号 量 的 标识 符 。 

fcntl 记 录 上 锁 : 不 必 编 写 任何 特殊 的 代码 ， 因 为 描述 符 可 通过 fork 
由 子 进 程 共享 。 

我 们 只 给 出 Posix 互 斥 锁 程 序 的 代码 。 

Posix 互 斥 锁 程 序 

Posix 互 斥 锁 程 序 的 main 函 数 使 用 一 个 Posix 互 斥 锁 来 提供 进程 间 的 
同步 形式 ， 如 图 A-48 所 示 。 图 A-47 给 出 了 它 的 incr 函 数 。 




















bench/incr_pxmutex5.c 





46 void * 


47 incr(void *arg) 

48 { 

49 int i; 

50 for (i = 0; i < nloop; i++) { 

51 Pthread_mutex_lock (&shared->mutex) ; 
52 shared->counter++; 

53 Pthread_mutex_unlock (&shared->mutex) ; 
54 } 

55 return (NULL) ; 

56 } 





bench/incr_pxmutex5.c 














图 A-47 测量 进程 间 Posix 互 斥 锁 上 锁 的 icr 函 数 


bench/incr_pxmutex5.c 





1 #include "unpipc.h" 
2 #define MAXNPROC 100 
3 int nloop; 


struct shared { 
pthread mutex t mutex; 
long counter; 
) *shared; /* pointer; actual structure in shared memory */ 


d Oo uU s 


8 void *incr(void *); 


9 int 

10 main(int argc, char **argv) 

iL { 

12 int i, nprocs; 

13 pid t  childpid[MAXNPROC] ; 
14 pthread mutexattr t mattr; 


图 A-48 进程 间 Posix 互 斥 锁 上 锁 测 量程 序 的 main 函 数 











15 if (argc != 3) 





16 err quit("usage: incr pxmutex5 <#loops> <#processes>") ; 
m7 nloop = atoi (argv[1]); 
18 nprocs = min (atoi (argv [2]), MAXNPROC) ; 
19 /* get shared memory for parent and children */ 
20 shared = My_shm (sizeof (struct shared) ) ; 
za /* initialize the mutex and lock it */ 
22 Pthread_mutexattr_init (&mattr) ; 
23 Pthread mutexattr setpshared(&mattr, PTHREAD PROCESS SHARED); 
24 Pthread mutex init(&shared-»mutex, &mattr); 
25 Pthread mutexattr destroy (&mattr); 
26 Pthread mutex lock(&shared-»mutex); 
27 /* create all the children */ 
28 for (i = 0; i « nprocs; i++) { 
29 if ( (childpid[i] = Fork()) == 0) { 
30 incr (NULL); 
31 exit (0); 
32 ) 
33 ) 
34 /* parent: start the timer and unlock the mutex */ 
35 Start time(); 
36 Pthread mutex unlock (&shared->mutex) ; 
37 /* wait for all the children */ 
38 for (i = 0; i « nprocs; i++) { 
39 Waitpid(childpid[i], NULL, 0); 
40 ) 
41 printf("microseconds: $.0f usec\n", Stop time()); 
42 if (shared-»counter !- nloop * nprocs) 
43 printf("error: counter = %ld\n", shared->counter) ; 
44 exit (0); 
45 } 
bench/incr_pxmutex5.c 
图 A-48 (5D 


19—20 “既然 使 用 多 个 进程 〈 一 个 父 进程 的 多 个 子 进程 )》 ， 我 们 就 
必须 把 shared 结 构 置 于 共享 内 存 区 中 。 我 们 调用 图 A-46 给 出 的 my_shm 函 
数 做 到 这 一 点 。 

21—26 “既然 互 斥 锁 处 于 共享 内 存 区 中 ， 我 们 束 不 能 静态 地 对 它 初 
始 化 ， 而 必须 在 设置 一 个 PTHREAD_PROCESS_SHARED 属 性 对 象 后 调 
用 pthread_mnutex_init 初 始 化 它 。 该 互 斥 锁 一 开始 是 锁 着 的 。 

27~36 ”创建 出 所 有 子 进 程 后 ， 父 进程 启动 定时 器 ， 并 给 互 斥 锁 解 





锁 。 


37 一 43 父 进 程 等 每 所 有 子 进 程 都 结束 ， 然 后 停止 定时 器 。 








[1]. megabyte 一 词 存在 歧义 。 我 们 在 它 代 表 220 字 节 时 译 为 M 字 节 ， 在 它 
代表 106 字 节 时 译 为 兆 字 节 。kilobyte 和 gigabyte 两 词 也 有 类 似 译 法 。 
一 一 译 者 注 





B.1 概述 

本 附录 汇总 基本 的 Posix 线 程 函 数 。 在 传统 的 Unix 模 型 中 ， 当 一 个 
进程 需要 由 另 一 个 实体 来 执行 某 件 事 时 ， 它 就 fork 一 个 子 进程 ， 让 子 进 
程 去 进行 处 理 。 举 例 来 襄 ，Unix 下 的 大 多 数 网 络 服 务 器 程序 就 是 这 么 编 
号 的 。 

尽管 这 种 模式 已 成 功 地 使 用 了 很 多 年 ， 但 是 fork 仍 然 暴露 出 了 以 下 
问题 。 

fork 的 开销 很 大 。 内 存 映像 要 从 父 进程 复制 到 子 进 程 ， 所 有 描述 符 
要 在 子 进程 中 复制 一 份 ， 等 等 。 当 前 的 系统 实现 使 用 一 种 称 为 写 时 复制 
(copy-on-write) 的 技术 ， 可 避免 父 进程 数据 空间 一 开始 就 癌 子 进程 复 
制 ， 直 到 子 进程 确实 需要 自己 的 副本 为 止 。 尽 管 有 这 种 优化 技术 ，fork 
的 开销 仍然 很 大 。 

fork 子 进程 后 ， 需 要 用 进程 间 通 信 (IPC) 在 父子 进程 之 间 传 递 信 
恩 。fork 之 前 由 父 进程 准备 好 的 信息 容易 传递 ， 因 为 子 进程 是 从 父 进 程 
的 数据 空间 及 所 有 描述 符 的 一 个 副本 开始 运行 的 。 但 是 从 子 进 程 返回 信 
息 给 父 进程 却 颇 费 周 折 。 

线程 有 助 于 解决 这 两 个 问题 。 线 程 有 时 称 为 轻 权 进程 〈lightweight 
process) ， 因 为 线程 比 进程 < 权 轻 >。 [1] 也 就 是 说 ， 创 建 线程 可 能 比 创 
建 进程 快 10 一 100 倍 。 

一 个 进程 内 的 所 有 线程 共享 同一 个 全 局 内 存 空间 。 这 使 得 线程 间 很 
容易 共享 信息 ， 但 是 这 种 容易 性 也 带 来 了 同步 〈synchronization ) 问 





























题 。 一 个 进程 内 的 所 有 线程 不 光 共 享 全 局 变量 ， 以 下 信息 也 是 它们 所 共 
享 的 : 

进程 指令 ; 

大 多 数 数 据 ; 

打开 的 文件 (例如 描述 符 〉; 

言 号 处 理 程序 和 信号 处 置 ，; 

当前 工作 目录 ; 

用 户 ID 和 组 ID。 

但 是 下 列 信息 却 是 特定 于 每 个 线程 的 : 

线程 ID; 

寄存 器 集合 ， 包 括 程 序 计数 器 和 栈 指针 ; 

栈 ( 用 于 存放 局 部 变量 和 返回 地 址 〉; 

errno; 

信号 掩 码 ; 

优先 级 。 

B.2 基本 线程 函数 : 创建 和 终止 

本 节 讨 论 5 个 基本 线程 函数 。 

B.2.1 pthread creater£ Zi 

当 一 个 程序 由 exec 启 动 执行 时 ， 系 统 将 创建 一 个 称 为 初始 线程 
(initial thread) 或 主线 程 (main thread) 的 单个 线程 。 其 余 线 程 则 由 
pthread_create 函 数 创建 。 

#include <pthread.h> 





int pthread_create(pthread_t *tid,const pthread_attr_t *attr, 
void *(*func)(void *),void *arg); 
返回 : 寿 成 功 则 为 0， 帮 出错 则 为 正 的 Exxx 值 
一 个 进程 内 的 各 个 线程 是 由 线程 ID (thread ID) 标识 的 ， 这 些 线程 
的 数据 类 型 为 pthread_ t。 如 果 新 的 线程 创建 成 功 ， 它 的 ID 就 通过 tid 指 针 


返回 。 
每 个 线程 有 多 个 属性 (attribute〉: 优先 级 、 初 始 栈 大 小 、 是 否 应 
该 是 一 个 守护 线程 ， 等 等 。 当 创建 线程 时 ， 我 们 可 通过 初始 化 一 个 
pthread_attr_t 变 量 来 指定 这 些 属性 以 宪 盖 默认 值 。 我 们 通常 采用 默认 

值 ， 这 种 情况 下 ， 我 们 只 需 把 attr 参 数 指定 为 一 个 空 指针 。 

最 后 ， 当 创建 一 个 线程 时 ， 我 们 应 指定 一 个 它 将 执行 的 函数 ， 称 为 
它 的 线程 启动 函数 (thread start function) 。 这 个 线程 以 调用 该 函数 开 
始 ， 以 后 或 者 显 式 地 终止 〈 调 用 pthread_exit) ， 或 者 隐 式 地 终止 (让 该 
函数 返回 ) 。 该 函数 的 地 址 作为 func 参 数 指 定 ， 该 函数 唯一 的 调用 参数 
则 是 一 个 指针 arg。 如 有 果 需 要 给 该 函数 传递 多 个 参数 ， 我 们 就 得 把 它们 
打包 成 一 个 结构 ， 然 后 将 其 地 址 作为 这 个 唯一 的 参数 ， 传 递 给 线程 启动 
函数 。 

注意 func 和 arg 的 声明 。func 函 数 接受 一 个 通用 指针 参数 〈void 
*) ， 返 回 一 个 通用 指针 (void *) 。 这 就 使 得 我 们 可 以 给 线程 传递 一 个 
指针 《指向 任何 我 们 想 要 指向 的 东西 ) ， 再 由 线程 返回 一 个 指针 《同样 
地 指向 任何 我 们 想 要 指 问 的 东西 )。 

Pthread 函 数 的 返回 值 有 两 种 : 成 功 时 返回 0， 出 错时 返回 非 零 。 与 
出 错时 返回 -1， 并 置 errno 为 某 个 正 值 的 大 多 数 系 统 函数 不 同 ，Pthread 函 
数 的 返回 值 是 正 值 的 出 错 指示 。 人 例如， 如果 pthread_create 函 数 因 为 超过 
了 系统 线程 数目 的 限制 而 不 能 创建 新 线程 ， 那 么 它 的 返回 值 将 是 
EAGAIN。Pthread 函 数 并 不 设置 errno。 成 功 时 返回 0， 出 错时 返回 非 零 
的 约定 不 成 问题 ， 因 为 在 <sys/errno.h> 头 文件 中 的 所 有 Exxx 值 都 大 于 0。 
0 值 永远 不 会 赋 给 任何 一 个 Exxx 常 值 。 

B.2.2 pthread joinrÉ Zi 

我 们 可 以 调用 pthread_ join 等 竺 一 个 线程 终止 。 把 线程 和 Unix 进 程 相 
比 ， pthread_create 类 似 于 fork，pthread_join 则 类 似 于 waitpid。 

#include <pthread.h> 











int pthread_join(pthread_t tid,void **status); 
BRE: ARDUO, F hA E Exxx ih 

34 ARE EERTE tid. HRE, Mea ARTEN 
终止 都 能 等 待 〈 类 似 于 给 waitpid 的 进程 ID 参数 传递 -1 值 的 情况 ) 。 

如 果 status 指 针 非 空 ， 那 么 所 等 竺 线程 的 返回 值 〈 指 同 某 个 对 象 的 
指针 ) 将 存放 在 status 指 向 的 位 置 。 

B.2.3 pthread_self 函 数 

每 个 线程 都 有 在 某 个 给 定 的 进程 内 标识 自身 的 一 个 ID。 这 个 线程 ID 
由 pthread_create 函 数 返 回 ， 我 们 已 看 到 pthread_join 函 数 用 到 它 。 一 个 线 
程 使 用 pthread_self 取 得 自己 的 线程 ID。 

#include <pthread.h> 





pthread_t pthread_self(void); 
返回 : 调用 线程 的 线程 ID 
把 线程 和 Unix 进 程 相 比较 ，pthread_self 类 似 于 getpid。 
B.2.4 pthread_detachej Zi 
线程 或 者 是 可 汇合 的 (joinable〉， 或 者 是 脱离 的 (detached) . 4 
可 汇合 的 线程 终止 时 ， 其 线程 ID 和 退出 状态 将 保留 ， 直 到 另外 一 个 线程 
调用 pthread_ join。 脱离 的 线程 则 像 守 护 进程 : 当 它 终止 时 ， 所 有 的 资源 
都 将 释放 ， 因 此 我 们 不 能 等 待 它 终止 。 如 果 一 个 线程 需要 知道 另 一 个 线 
程 的 终止 时 间 ， 那 就 最 好 保留 第 二 个 线程 的 可 汇合 性 。 
pthread_detach 函 数 将 指定 的 线程 变 为 脱离 的 。 
#include <pthread.h> 
int pthread_detach(pthread_t tid); 
返回 : ARIDO, A Ha AEAEE 
该 函数 通常 由 想 让 自己 脱离 的 线程 使 用 ， 例 如 : 
pthread_detach(pthread_self()); 
B.2.5 pthread_exit PA 2 


终止 一 个 线程 的 方法 之 一 是 调用 pthread_exit。 

#include <pthread.h> 

void pthread_exit(void *status); 

不 返回 到 调用 者 

如 果 该 线程 未 脱离 ， 那 么 其 线程 ID 和 退出 状态 将 一 直 保 留 到 调用 进 

程 内 的 另外 某 个 线程 调用 pthread_ join 为止 。 
虽 针 status 不 能 指向 局 部 于 调用 线程 的 对 象 〈 例 如 该 线程 的 局 动 函 

数 中 的 某 个 自动 变量 ) ， 因 为 该 线程 终止 时 那个 对 象 也 消失 了 。 

使 一 个 线程 终止 还 有 其 他 两 种 方法 。 

启动 该 线程 的 函数 (pthread_create 的 第 三 个 参数 ) 可 以 调用 
retum。 既 然 该 函数 必须 声明 成 返回 一 个 void 指针 ， 该 返回 值 便 是 该 线程 
的 终止 状态 。 

如 果 本 进程 的 main 函 数 返 回 ， 或 者 某 个 线程 调用 了 exit 或 _exit， 那 
么 该 进程 将 立即 终 

止 ， 它 的 仍 在 运行 的 任意 线程 也 都 将 终止 。 











[1]. 线程 和 轻 权 进程 实际 上 有 是 不 同 的 概念 。Solaris 2.x 下 实际 存在 内 核 线 
程 、 轻 权 进 程 和 用 户 线 程 三 个 概念 。 一 一 译 者 注 


C.1 unpipc.h 头 文件 

本 书 正文 中 几乎 每 个 程序 都 包含 了 我 们 的 unpipc.h 头 文件 ， 它 如 图 
C-1 所 示 。 该 头 文件 包含 了 大 多 数 网 络 程序 需要 的 所 有 标准 系统 头 文件 
以 及 一 些 普通 的 系统 头 文 件 。 它 还 定义 了 诸如 MAXLINE 等 常 值 和 我 们 
己 在 正文 中 定义 过 的 函数 (例如 px_ipc_name) ， 以 及 所 用 到 的 所 有 包 
里 函数 的 ANSI C 函 数 原 型 。 不 过 这 儿 没 有 给 出 这 些 原型 。 





lib/unpipc.h 





/* Our own header. Tabs are set for 4 spaces, not 8 */ 


#ifndef . unpipc h 
#define . unpipc h 
#include "../config.h" /* configuration options for current OS */ 


/* "../config.h" is generated by configure */ 


/* If anything changes in the following list of #includes, must change 
../aclocal.m4 and ../configure.in also, for configure's tests. */ 


#include <sys/types.h> /* basic system data types */ 
#include <sys/time.h> /* timeval{} for select () */ 
#include «time.h» /* timespec{} for pselect() */ 
#include <errno.h> 

#include «fcntl.h» /* for nonblocking */ 

#include <limits.h> /* PIPE_BUF */ 


#include <signal.h> 

#include <stdio.h> 

#include <stdlib.h> 

#include <string.h> 

#include <sys/stat.h> /* for S xxx file mode constants */ 
#include <unistd.h> 

dinclude <sys/wait.h> 


#ifdef HAVE MQUEUE H 
# include <mqueue.h> /* Posix message queues */ 
#endif 


#ifdef HAVE SEMAPHORE H 
# include <semaphore.h> /* Posix semaphores */ 


#ifndef SEM FAILED 
Hdefine SEM FAILED ((sem t *)(-1)) 
#endif 


#endif 


#ifdef HAVE SYS MMAN H 





图 C-1 我 们 的 unpipc.h 头 文件 
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# include <sys/mman.h> 
#endif 


#ifndef MAP_FAILED 


/* Posix shared memory */ 


#define MAP FAILED ((void *) (-1)) 


#endif 


#ifdef HAVE SYS IPC H 
# include <sys/ipc.h> 
#endif 


#ifdef HAVE SYS MSG H 
# include <sys/msg.h> 
#endif 


#ifdef HAVE SYS SEM H 
#ifdef _ bsdi 

#undef HAVE SYS SEM H 
#else 

# include <sys/sem.h> 
#endif 


#ifndef HAVE SEMUN UNION 


union semun { 


int val; 
struct semid ds *buf; 
unsigned short *array; 
N 
#endif 
#endif /* HAVE SYS SEM H */ 


#ifdef HAVE SYS SHM H 
4 include <sys/shm.h> 
#endif 


#ifdef HAVE SYS SELECT H 
# include  «sys/select.h» 


#endif 


#ifdef HAVE POLL H 
# include <poll.h> 
#endif 


#ifdef HAVE STROPTS H 
# include <stropts.h> 
#endif 


#ifdef HAVE STRINGS H 
# include <strings.h> 
#endif 


/* Next three headers are normally needed for socket/file ioctl's: 
* <sys/ioctl.h>, <sys/filio.h>, and <sys/sockio.h>. 


*/ 
#ifdef HAVE SYS IOCTL H 


4 include  «sys/ioctl.h» 


#endif 
#ifdef HAVE SYS FILIO H 


# include <sys/filio.h> 


#endif 
#ifdef HAVE PTHREAD H 


/* 


/* 


/* 
/* 


/* 


/* 


/* 


/* 


/* 


/* 


System V IPC */ 


System V message queues */ 


hack: BSDI's semctl() prototype is wrong */ 


System V semaphores */ 


define union for semctl() */ 


System V shared 


for 


for 


for 


for 


convenience */ 


convenience */ 


convenience */ 


convenience */ 


memory */ 
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81 # include <pthread.h> 


82 #endif 

83 #ifdef HAVE DOOR H 

84 # include <door.h> /* Solaris doors API */ 

85 #endif 

86 #ifdef HAVE RPC RPC H 

87 #ifdef PSX4 NSPACE H TS /* Digital Unix 4.0b hack, hack, hack */ 
88 #undef SUCCESS 

89 #endif 

90 # include <rpc/rpc.h> /* Sun RPC */ 

91 #endif 


92 /* Define bzero() as a macro if it's not in standard C library. */ 
93 #ifndef HAVE BZERO 

94 #define bzero(ptr,n) memset (ptr, 0, n) 

95 #endif 


96 /* Posix.lg requires that an #include of <poll.h> DefinE INFTIM, but many 
97 systems still DefinE it in <sys/stropts.h>. We don't want to include 
98 all the streams stuff if it's not needed, so we just DefinE INFTIM here. 
99 This is the standard value, but there's no guarantee it is -1. */ 

100 #ifndef INFTIM 


101 #define INFTIM (-1) /* infinite poll timeout */ 

102 #ifdef HAVE POLL H 

103 #define INFTIM UNPH /* tell unpxti.h we defined it */ 
104 #endif 

105 #endif 

106 /* Miscellaneous constants */ 

107 #ifndef PATH MAX /* should be in <limits.h> */ 

108 #define PATH MAX 1024 /* max # of characters in a pathname */ 
109 #endif 

110 #define MAX PATH 1024 

111 #define MAXLINE 4096 /* max text line length */ 

112 #define BUFFSIZE 8192 /* buffer size for reads and writes */ 
113 #define FILE MODE (S IRUSR | S IWUSR | S IRGRP | S IROTH) 

114 /* default permissions for new files */ 

115 #define DIR MODE (FILE MODE | S IXUSR | S IXGRP | S IXOTH) 

116 /* default permissions for new directories */ 


117 #define SVMSG MODE (MSG R | MSG W | MSG R»»3 | MSG R>>6) 

118 /* default permissions for new SV message queues */ 
119 #define SVSEM MODE (SEM R | SEM A | SEM R>>3 | SEM R>>6) 

120 /* default permissions for new SV semaphores */ 

121 #define SVSHM MODE (SHM R | SHM W | SHM R»»3 | SHM R>>6) 

122 /* default permissions for new SV shared memory */ 


123 typedef void Sigfunc(int); /* for signal handlers */ 


124 #ifdef HAVE SIGINFO T STRUCT 
125 typedef void Sigfunc rt(int, siginfo t *, void *); 


126 #endif 
127 #define min(a,b) ((a) « (b) ? (a) : (b)) 
128 #define max(a,b) ((a) » (b) ? (a) : (b)) 


129 #ifndef HAVE TIMESPEC STRUCT 
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130 struct timespec { 


qu time t tv sec; /* seconds */ 

132 long tv nsec; /* and nanoseconds */ 

133 ); 

134 #endif 

135 /* 

136 * In our wrappers for open(), mq open(), and sem open() we handle the 
137 ^* optional arguments using the va XXX() macros. But one of the optional 
138 * arguments is of type "mode t" and this breaks under BSD/OS because it 
139 * uses a 16-bit integer for this datatype. But when our wrapper function 
140 * is called, the compiler expands the 16-bit short integer to a 32-bit 
141 * integer. This breaks our call to va arg(). All we can do is the 

142 * following hack. Other systems in addition to BSD/OS might have this 
143 * problem too ... 

144 */ 


145 #ifdef _ bsdi — 
146 #define va mode t int 


147 #else 

148 #define va mode t mode t 

149 #endif 

150 /* our record locking macros */ 

151 #define read lock(fd, offset, whence, len) \ 

152 lock reg(fd, F SETLK, F RDLCK, offset, whence, len) 
153 #define readw lock(fd, offset, whence, len) \ 

154 lock reg(fd, F SETLKW, F RDLCK, offset, whence, len) 
155 #define write lock(fd, offset, whence, len) \ 

156 lock reg(fd, F SETLK, F WRLCK, offset, whence, len) 
157 #define writew lock(fd, offset, whence, len) \ 

158 lock reg(fd, F SETLKW, F WRLCK, offset, whence, len) 
159 #define un lock(fd, offset, whence, len) \ 

160 lock reg(fd, F SETLK, F UNLCK, offset, whence, len) 
161 #define is read lockable(fd, offset, whence, len) \ 

162 lock test(fd, F RDLCK, offset, whence, len) 

163 #define is write lockable(fd, offset, whence, len) \ 

164 lock test(fd, F WRLCK, offset, whence, len) 


lib/unpipc.h 
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C.2 config.h 头 文件 

本 书 中 使 用 了 GN.autoconf 工 具 以 辅助 所 有 源 代码 的 移植 。 它 可 以 从 
ftp://prep.ai.mit.edu/pub/gnu 获 取 。 这 个 工具 生成 一 个 名 为 configure 的 
shell 肢 本， 在 把 软件 下 载 到 你 的 系统 后 你 必须 运行 该 脚本 。 这 个 脚本 确 
定 你 的 Unix 系 统 所 提供 的 特性 : 文 持 Syste.V 消 息 队 列 吗 ? 定义 unit8_t 数 
据 类 型 了 吗 ? 提供 gethostname 函 数 了 吗 ? 等 等 ， 最 终生 成 一 个 名 为 
config.h 的 头 文件 。 它 是 上 节 介 绍 的 unpipc.h 头 文件 中 包含 的 第 一 个 头 文 


件 。 图 C-2 给 出 了 在 使 用 gcc 编 译 器 的 前 提 下 ， 在 Solari.2.6 系 统 上 生成 的 
config.h3- x fF, 

其 中 从 第 1 列 开 始 以 拓 efine 开 头 的 行 代 表 系 统 提供 了 的 特性 。 注 释 
挥 并 且 含 有 #ndef 的 行 代 表 系 统 没有 提供 的 特性 。 
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sparc-sun-solaris2.6/config.h 


/* config.h. Generated automatically by configure.  */ 
/* Define the following if you have the corresponding header */ 
#define CPU VENDOR OS "sparc-sun-solaris2.6" 

define HAVE DOOR H 1 /* «door.h» */ 
#define HAVE MQUEUE H 1 /* «mqueue.h» */ 
#define HAVE POLL H 1 /* «poll.h» */ 
#define HAVE PTHREAD H 1 /* «pthread.h» */ 
#define HAVE RPC RPCH 1 /* «rpc/rpc.h» */ 
#define HAVE SEMAPHORE H 1 /* «semaphore.h» */ 
#define HAVE STRINGS H 1 /* «strings.h» */ 
#define HAVE SYS FILIO H 1 /* «sys/filio.h» */ 
#define HAVE SYS IOCTL H 1 /* «sys/ioctl.h» */ 
Hdefine HAVE SYS IPCH 1 /* «sys/ipc.h» */ 
#define HAVE SYS MMAN H 1 /* «sys/mman.h» */ 
#define HAVE SYS MSG H 1 /* «sys/msg.h» */ 
#define HAVE SYS SEM H 1 /* «sys/sem.h» */ 
#define HAVE SYS SHM H 1 /* «sys/shm.h» */ 
#define HAVE SYS SELECT H 1 /* «sys/select.h» */ 
/* #undef HAVE SYS SYSCTL H */ /* «sys/sysctl.h» */ 
#define HAVE SYS TIME H 1 /* «sys/time.h» */ 


/* Define if we can include «time.h» with «sys/time.h» */ 


#define TIME WITH SYS TIME 1 


/* Define the following if the function is provided */ 


#define HAVE BZERO 1 
define HAVE FATTACH 1 
#define HAVE POLL 1 

/* #undef HAVE PSELECT */ 
#define HAVE SIGWAIT 1 
&define HAVE VALLOC 1 
#define HAVE VSNPRINTF 1 


/* Define the following if the function prototype is in a header */ 


#define HAVE GETHOSTNAME PROTO 1 /* 
#define HAVE GETRUSAGE PROTO 1 /* 
/* #undef HAVE PSELECT PROTO */ /* 
#define HAVE SHM OPEN PROTO 1 y* 


#define HAVE SNPRINTF PROTO 1 /* 
#define HAVE THR SETCONCURRENCY PROTO 1 


#define HAVE SIGINFO T STRUCT 1 


#define HAVE TIMESPEC STRUCT 1 /* 


«unistd.h» 
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«sys/resource.h» */ 


«sys/select 


.h» */ 


«sys/mman.h» */ 


«stdio.h» * 


/ 


/* «thread.h» */ 
/* Define the following if the structure is defined. */ 


«time.h» */ 


/* «signal.h» */ 


/* #undef | HAVE SEMUN UNION */ /* «sys/sem.h» */ 
/* Devices */ 

#define HAVE DEV ZERO 1 

/* Define the following to the appropriate datatype, if necessary */ 
/* #undef ints t */ /* «sys/types.h» */ 
/* #undef intl6 t */ /* «sys/types.h» */ 
/* $undef int32_t */ /* esys/types.h> */ 
/* #undef uints t */ /* <sys/types.h> */ 
/* #undef | uintl6 t */ /* «sys/types.h» */ 
/* #undef | uint32 t */ /* «sys/types.h» */ 
/* #undef size t */ /* «sys/types.h» */ 
/* #undef ssize t */ /* <sys/types.h> */ 
#define POSIX_IPC_PREFIX "/" 


#tdefine RPCGEN ANSIC 1 


/* defined if rpcgen 


groks -C option */ 
sparc-sun-solaris2.6/config.h 


图 C-2 Solaris 2.6 上 的 config.h 头 文件 
C.3 标准 错误 处 理 函 数 
我 们 定义 了 一 组 自己 的 错误 处 理 函 数 ， 它 们 用 在 整 本 书 中 以 处 理 出 
错 情况 。 定 义 一 组 自己 的 错误 处 理 函 数 的 原因 在 于 ， 我 们 可 以 用 一 行 简 
单 的 C 代 码 编写 错误 处 理 过程 ， 就 像 如 下 所 示 : 
if (出 错 条 件 ) 
err_sys( 带 任意 数目 的 参数 的 printf 格 式 串 ); 
而 不 是 如 下 所 示 用 多 行 : 
if (出 错 条 件 ) 
char buff[200]; 
snprintf(buff,sizeof(buff), 带 任意 数目 的 参数 的 printf 格 式 串 ); 
perror(buff); 














exit(1); 
} 

我 们 的 错误 处 理 函 数 使 用 来 自 ANSI C 的 可 变 长 度 参 数 表 机 制 。 具 
体 细节 参见 [Kernighan and Ritchie 1988] 的 7.3 节 。 

图 C-3 列 出 了 各 个 错误 处 理 函 数 之 间 的 差异 。 如 果 全 局 整数 
daemon_proc 非 零 ， 那 么 当前 出 错 消息 将 按 指定 的 级 别传 递 给 syslog〈 关 
于 syslog 的 细节 参见 UNPVl 第 12 章 ) ; 人 否则， 当前 出 错 消 息 输 出 到 标准 
错误 输出 。 


nyilo 


err_dump abort () ; LOG ERR 


err msg return; LOG INFO 


err quit exit (1) LOG ERR 


err: Tert return; LOG INFO 


err Sys H exit (1) LOG_ERR 














图 C-3 标准 错误 处 理 函 数 汇总 
图 C-4 给 出 了 图 C-3 所 示 的 5 个 函数 。 








Yi b/error.c 
1 #include "unpipc.h" 
2 #include <stdarg.h> /* BNSI C header file */ 
3 #include <syslog.h> /* for syslog() */ 
4 int daemon_proc; /* set nonzero by daemon_init() */ 


5 static void err doit(int, int, const char *, va list); 


6 /* Nonfatal error related to a system call. 
7 * Print a message and return. */ 


8 void 

9 err ret(const char *fmEt, mea) 

10 ( 

Tl va list ap; 

12 va start(ap, fmt); 

13 err doit(1, LOG INFO, fmt, ap); 
14 va end(ap); 


15 return; 


图 C-4 我 们 的 标准 错误 处 理 函 数 


16 


17 
18 


T9 
20 
21 
22 


23 
24 
25 
26 
27 


28 
29 


30 
31 
32 
33 


34 
35 
36 
37 
38 
39 


40 
41 


42 
43 
44 
45 


46 
47 
48 
49 
50 


51 
52 


53 
54 
55 
56 


E7 
58 
59 
60 
61 


62 
63 


} 


/* Fatal error related to a system call. 
* Print a message and terminate. */ 
void 
err_sys(const char *fmt, ...) 
{ 
va_list ap; 
va_start(ap, fmt); 
err doit(1, LOG ERR, fmt, ap); 
va end(ap); 
exit (1); 
} 
/* Fatal error related to a system call. 
* Print a message, dump core, and terminate. */ 
void 
err_dump(const char *fmt, ...) 
{ 
va list ap; 
va start(ap, fmt); 
err doit(1, LOG ERR, fmt, ap); 
va end(ap); 
abort () ; /* dump core and terminate */ 
exit(1); /* shouldn't get here */ 
} 
/* Nonfatal error unrelated to a system call. 
* Print a message and return. */ 
void 
err msg(const char *fmt, ...) 
{ 
va_list ap; 
va start(ap, fmt); 
err doit(0, LOG INFO, fmt, ap); 
va end(ap); 
return; 
) 
/* Fatal error unrelated to a system call. 
* Print a message and terminate. */ 
void 
err quit(const char *fmt, ...) 
{ 
va_list ap; 
va_start(ap, fmt); 
err_doit(0, LOG_ERR, fmt, ap); 
va _ end (ap) ; 
exit (1) ; 
} 
/* Print a message and return to caller. 
* Caller specifies "errnoflag" and "level". */ 
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64 static void 
65 err doit(int errnoflag, int level, const char *fmt, va list ap) 


66 ( 

67 int errno save, n; 

68 char buf [MAXLINE]; 

69 errno save = errno; /* value caller might want printed */ 

70 #ifdef HAVE VSNPRINTF 

71 vsnprintf (buf, sizeof (buf), fmt, ap); /* this is safe */ 
72 #else 

73 vsprintf (buf, fmt, ap); /* this is not safe */ 
74 #endif 

75 n - strlen(buf); 

76 if (errnoflag) 

72 snprintf (buf+n, sizeof(buf)-n, ": $s", strerror(errno save)); 
78 strcat(buf, "\n"); 

79 if (daemon proc) ( 

80 syslog(level, buf); 

81 ) else { 

82 fflush (stdout) ; /* in case stdout and stderr are the same */ 
83 fputs (buf, stderr) ; 

84 fflush(stderr) ; 

85 } 

86 return; 

87 } 
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第 1 章 

1.4 这 两 个 进程 只 需 给 open 函 数 指定 O_APPEND 标 志 ， 或 者 给 fopen 
函数 指定 添加 模式 。 内 核 保证 每 次 write 都 将 新 的 数据 添加 到 该 文件 的 末 
尾 。 这 是 可 指定 的 最 容易 的 文件 同步 形式 (APUE 第 60 一 61 页 [1] 对 此 
AAAI) 。 当 更 新 文件 中 已 有 的 数据 时 ， 同 步 问题 会 变 得 复杂 起 
来 ， 数 据 库 系统 中 的 情况 就 是 这 样 。 

1.2 典型 的 定义 类 似 如 下 : 

#ifdef REENTRANT 

#define errno (*_errno()) 

#else 

extern int errno; 

#endif 

ap REENTRANT Ge X, 5|Hermol gti H]—4^ 44 A_ermoft) ER 
数 ， 该 函数 返回 调用 线程 的 errno 变 量 的 地 址 。 该 变量 可 能 是 作为 线程 特 
定数 据 CUNPv1 的 23.5 节 [2] ) 存储 的 。 如 果 _REENTRANT 未 定义 ， 
errno 就 是 一 个 全 局 int 变 量 。 

第 2 章 

2.1 这 两 位 能 改变 待 运行 程序 的 有 效用 户 ID 和 /或 有 效 组 ID。2.4 市 中 
用 到 了 这 两 个 有 效 ID。 

2.2 首先 同时 指定 O_CREAT 和 O_EXCL 标 志 ， 如 果 成 功 返 回 ， 那 么 
已 创建 了 一 个 新 对 象 。 然 而 如 果 调 用 失败 并 返回 EEXIST 错 误 ， 那 么 对 

















象 已 经 存在 ， 程 序 于 是 得 再 次 调用 打开 函数 ， 不 过 不 再 同时 指定 
O_CREAT 和 O_EXCL 标 志 。 第 二 次 调用 应 该 成 功 ， 但 是 调用 失败 并 返 
加 ENOENT 错 误 的 机 会 仍然 存在 (尽管 很 小 ) ， 它 表明 在 这 两 次 调用 之 
间 ， 另 外 某 个 线程 或 进程 已 将 该 对 象 删除 了 。 

第 3 章 

3.1 我 们 的 程序 AED aN: 

32 ”第 二 个 程序 运行 时 ， 第 一 次 调用 msgget 使 用 的 是 第 一 个 可 用 的 
消息 队列 ， 其 槽 位 使 用 序 M men 7 中 的 程序 两 次 之 后 变 为 20， 
因而 返回 的 标识 符 值 为 1000。 假 设 下 一 个 可 用 的 消息 队列 从 未 使 用 过 
其 模 位 使 用 序列 号 于 是 为 0， 因 而 返回 的 标识 符 值 为 1。 

3.3 我 们 的 简单 程序 如 图 D-2 所 示 。 

















svmsg/slotseq.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

& d 

5 int i, msqid; 

6 struct msqid ds info; 

7è for (i = 0; i < 10; i++) { 

8 msqid = Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
9 Msgctl(msqid, IPC STAT, &info); 

10 printf ("msqid = $d, seq = %lu\n", msqid, info.msg perm.seq); 
14: Msgctl(msqid, IPC RMID, NULL); 
12 ) 
13 exit(0); 
14 } 





svmsg/slotseq.c 





图 D-1 输出 标识 符 和 楼 位 使 用 序列 号 





svmsg/testumask.c 
1 #include "unpipc.h" 


2 int 

3 main(int argc, char **argv) 

4 { 

5 Msgget(IPC PRIVATE, 0666 | IPC CREAT | IPC EXCL); 
6 unlink("/tmp/fifo.1"); 

7 Mkfifo("/tmp/fifo.1", 0666); 


8 exit (0); 





svmsg/testumask.c 





























图 D-2 测试 msgget 是 否 使 用 文件 模式 创建 掩 码 
从 下 面 的 程序 运行 情况 可 以 看 出 ， 文 件 模式 创建 掩 码 是 2〈 关 邱 其 
他 用 户 写 位 〉，， 该 位 在 FIFO 中 确实 关 挥 ， 在 消 恩 队列 中 却 并 未 关 挥 。 
solaris % umask 
02 


solaris % testumask 











solaris 96 ls -l /tmp/fifo.1 

prw-rw-r--  1rstevens other1 0 Mar 25 16:05 /tmp/fifo.1 

solaris 96 ipcs -q 

IPC status from «running system? as of Wed Mar 25 16:06:03 1998 

T ID KEY MODE 
OWNER GROUP 

Message Queues: 

q 200 00000000 --rw-rw-rw- rstevens other1 

3.4 使 用 ftok 的 话 ， 系 统 中 另外 茶 个 路 径 名 所 形成 的 键 与 我 们 的 服务 
器 所 用 的 键 相 同 的 可 能 性 总 是 存在 。 使 用 IPC_PRIVATE 的 话 ， 服 务 器 
尽管 知道 它 是 在 创建 新 的 消 乱 队列 ， 但 它 必 须 接 着 把 所 创建 消息 队列 的 
标识 符 写 到 某 个 文件 中 ， 供 客户 读 取 。 

3.5 下 面 是 检测 冲突 的 方法 之 一 : 

solaris % find / -links 1 -not -type | -print | 





xargs -n1 ftok1 > temp.1 
solaris 96 wc -l temp.1 
109351 temp.1 
solaris 96 sort +0 -1 temp.1 | 
nawk '( if (lastkey == $1) 
print lastline,$0 
lastline = $0 


lastkey = $1 
}' > temp.2 
solaris % wc -l temp.2 
82188 temp.2 

在 find 程 序 中 ， 我 们 忽略 链接 数 多 于 一 个 的 文件 (因为 每 个 链接 都 
有 相同 的 索引 节点 ) ， 符 号 链接 也 忽略 (因为 stat 函 数 沿 循 符号 链接 ， 
也 就 是 说 解释 并 蔡 换 符号 链接 ， 直 到 不 再 有 新 的 符 豆 链接) 。 很 高 的 冲 
突 比 率 (75.2%) 是 由 于 Solaris 2.x 只 使 用 了 索引 节点 号 中 的 12 位 。 这 意 
味 着 在 文件 数 多 于 4096 的 任何 文件 系统 中 ， 有 许多 冲突 会 发 生 。 例 如 索 
引 节点 号 分 别 为 4096、8192、12288 和 16384 的 4 个 文件 都 有 相同 的 IPC 键 
(假设 它们 在 同 二 个 文件 系统 中 》。 

下 一 个 例子 运行 在 同样 的 文件 系统 上 ， 但 使 用 的 是 来 自 BSD/OS 的 
ftok 疯 数 。 由 于 该 函数 把 整个 索引 节点 号 加 a 到 键 中 ， 因 此 冲突 数 只 有 
849 ( 少 于 1%) 。 

第 4 章 

4.1 当 父 进程 终止 时 ， 如 果子 进程 中 fdq[1] 处 于 打开 状态 ， 那 么 子 进 
程 对 fd[0] 的 read 不 会 返回 文件 结束 符 ， 因 为 fd[1] 在 子 进 程 中 仍然 打开 。 
在 子 进程 中 关闭 fd[1] 保 证 一 旦 父 进程 终止 ， 它 的 所 有 描述 符 即 关 闭 ， 从 
而 使 得 子 进程 对 fd[0] 的 read 返 回 0。 

4.2 ”如 果 调 用 关系 反 转 了 ， 男 外 某 个 进程 就 有 可 能 在 本 进程 的 open 
和 mkfifo 两 个 调用 之 间 创 建 本 进程 想 要 创建 的 FIFO， 结 果 导 致 本 进程 的 
mkfifo 调 用 失败 。 

4.3 如 有 果 执 行 如 下 命令 : 


solaris % mainpopen 2>temp.stderr 








/etc/ntp.conf > /myfile 
solaris % cat temp.stderr 


sh: /myfile: cannot create 


那么 我 们 看 到 popen 返 回 成 功 ， 但 是 我 们 用 fgets 读 到 的 只 是 一 个 文 
(FAERIT. shell 出错 消息 是 写 到 标准 错误 输出 的 。 

4.5 把 第 一 个 open 调 用 改 为 指定 非 阻 塞 标志 : 

readfifo = Open(SERV_FIFO,O_RDONLY | O NONBLOCK,0); 

该 调用 将 立即 返回 ， 接 下 去 的 open 调 用 (用 于 只 写 ) 也 立即 返回 ， 
因为 它 要 打开 的 FIFO 已 经 由 第 一 个 open 调 用 打开 用 于 读 。 但 是 为 了 避免 
从 readline 返 回 错误 ， 摘 述 符 readfifo 的 O NONBLOCK 标 志 必 须 在 调用 
readline% Fil «fii o 

4.6 ”如果 客户 在 打开 服务 器 的 众所周知 FIFO〔 用 于 只 写 ) 之 前 先 打 
开 它 的 客户 特定 FIFO CHF RIX) ， 那 么 会 发 生死 锁 。 避 免 这 种 死 锁 的 
唯一 办 法 是 如 图 4-24 中 所 示 的 顺序 open 这 两 个 FIFO， 也 可 以 使 用 非 阻塞 
标志 。 

4.7 写 进程 天 闭 管道 或 FIFO 的 信息 通过 文件 结束 符 传 递 给 读 进 程 。 

4.8 图 D-3 给 出 了 我 们 的 程序 。 

4.9 select 返回 说 该 描述 符 是 可 写 的 ， 但 调用 write 却 引发 SIGPIPE 信 
号 。 这 个 概念 在 UNPv1 第 153 一 155 页 [3] 说 明 过 ， 当 发 生 读 〈 或 写 ) 错 
误 时 ，select 返 回 说 相应 描述 符 是 可 读 的 《或 可 写 的 ) ， 真 正 的 错误 则 
由 read (EXwrite) 人 返回。 图 D-4 给 出 了 我 们 的 程序 。 





pipe/testl.c 








1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fd[21; 

6 char buff [7] ; 

7 struct stat info; 

8 if (argc !- 2) 

9 err quit("usage: testl <pathname>") ; 

10 Mkfifo(argv[1], FILE MODE); 

11 fd[0] = Open(argv[1], O RDONLY | O NONBLOCK); 

12 fd[1] = Open(argv[1], O WRONLY | O NONBLOCK); 

13 /* check sizes when FIFO is empty */ 

14 Fstat(fd[0], &info); 

15 printf("fd[0]: st size = $1dWMn", (long) info.st size); 
16 Fstat(fd[1], &info); 

17 printf("fd[1]: st size = %ld\n", (long) info.st size); 
18 Write(fd[1], buff, sizeof (buff) ); 

19 /* check sizes when FIFO contains 7 bytes */ 

20 Fstat(fd[0], &info) ; 

2l printf("fd[0]: st size = %ld\n", (long) info.st size); 
22 Fstat(fd[1], &info); 

23 printf("fd[1]: st size = %ld\n", (long) info.st size); 
24 exit(0); 

25 ) 


pipe/testl.c 





图 D-3 判定 fstat 是 否 返 回 在 某 个 FIFO 中 的 字 节 数 





pipe/test2.c 











1 #include "unpipc.h" 

2 unt 

3 main(int argc, char **argv) 

4 ( 

5 int fd[2], n; 

6 pid t childpid; 

7 fd set wset; 

8 Pipe (fd) ; 

9 if ( (childpid = Fork()) == 0) { /* child */ 
10 printf ("child closing pipe read descriptor\n") ; 
Ta Close (fd[0]); 

12 sleep (6) ; 
13 exit (0); 
14 } 
15 /* parent */ 
16 Close (fd[0]) ; /* in case of a full-duplex pipe */ 
17 sleep(3); 
18 FD ZERO (&wset) ; 
19 FD SET(fd[1], &wset); 
20 n = select(fd[1] + 1, NULL, &wset, NULL, NULL); 
21 printf ("select returned $dWMn", n); 
22 if (FD ISSET(fd[1], &wset)) ( 
23 printf("fd[1] writable\n") 
24 Write(fd[1], "hello", 5); 
25 ) 
26 exit(0); 
27 } 
pipe/test2.c 
图 D-4 当 一 个 管道 的 读 出 端 关 闭 时 ， 判 定 select 为 可 写 性 返回 的 是 什么 
A^ m SP 
Po 


5.1 先 不 指定 任何 属性 创建 该 队列 ， 紧 接着 调用 mq_getattr 取 得 默认 
属性 。 随 后 删除 该 队列 并 重新 创建 ， 对 未 指定 的 那个 属性 使 用 其 默认 
值 。 





5.2. ”对 应 第 二 个 消息 的 信号 没有 产生 是 因为 注册 在 每 次 通知 发 生 之 
后 即 撤销 。 
5.3 ”对 应 第 二 个 消息 的 信号 没有 产生 是 因为 接收 该 消息 时 队列 不 





Hi 


5.4 Solaris 2.6 把 这 两 个 常 值 定义 成 调用 sysconf， 其 上 的 GNU C 编 译 
强 将 产生 如 下 出 错 消息 : 
test1.c:13: warning: int format,long int arg (arg 2) 


test1.c:13: warning: int format,long int arg (arg 3) 





5.5 在 Solaris 2.6 下 ， 我 们 指定 1 000 000 个 消息 ， 每 个 消息 10 字 节 。 
这 使 文件 大 小 为 20 000 536 字 节 ， 它 与 我 们 运行 图 5-5 中 程序 所 得 的 结 
是 一 致 的 : 每 个 消息 占据 10 字 节 数 据 、8 字 节 开 销 《〈 也 许 是 为 存放 指 
针 ) 以 及 另外 2 字 节 开销 (也 许 因 4 字 节 对 齐 之 需 ) ， 每 个 文件 再 占据 
536 字 节 开 销 。 在 调用 mq_open 之 前 ， 由 ps 所 报告 的 该 程序 大 小 为 
1052KB， 该 消息 队列 创建 之 后 ， 大 小 变 为 20MB。 这 使 得 我 们 认为 Posix 
消息 队列 是 使 用 内 存 映射 文件 实现 的 ，mq_open 把 该 文件 映射 到 调用 进 
程 的 地 址 空间 中 。 在 Digital Unix 4.0B 下 我 们 也 取得 了 类 似 的 结果 。 

5.. 对 于 ANS..memXXX 函 数 来 次， 大 小 参数 为 0 不 成 问题 。 最 初 的 
198.ANS.C 标 准 X3.159-1989 (也 称 为 ISO/IE.9899:1990〉 并 没有 这 么 
说 ， 作 者 能 找到 的 手册 页 面 也 没有 一 个 提 及 这 一 点 ， 然 
Tj ^Technica.Corrigendu.Numbe.1 (1 号 技术 勘误 )” 却 明确 陈述 大 小 为 0 
可 行 《 不 过 指针 参数 仍 必须 有 效 ) 。 要 参阅 有 关 C 语 言 的 信息 ， 
http://www.lysator.liu.se/c/ 是 个 颇 值 访问 的 地 方 。 

5.7 两 进程 之 间 的 双 癌 通信 需 2 个 消息 队列 (图 A-30 是 这 样 的 一 个 例 
P) 。 事 实 上 ， 要 是 我 们 把 图 4-14 中 程序 改 为 使 用 Posix 消 息 队 列 而 不 是 
管道 ， 就 会 看 到 父 进程 读 回 它 写 到 队列 中 的 东西 。 

58 互 斥 锁 和 条 件 变量 包含 在 内 存 映 射 文件 中 ， 而 该 文件 是 由 打开 
了 相应 队列 的 所 有 进程 共享 的 。 其 他 进程 也 许 打开 着 该 队列 ， 因 此 即将 
关闭 该 队列 本 地 句柄 的 一 个 进程 不 能 摧毁 该 互 斥 锁 和 条 件 变 量 。 

5.9 C 语 言 中 数组 不 能 通过 等 号 赋值 ， 结 构 却 可 以 。 

5.10 main 函数 几乎 把 所 有 时 间 都 花 在 select 调 用 的 阻 堵 之 中 ， 等 符 
管道 变 为 可 读 。 每 次 提交 相应 信号 时 ， 其 信号 处 理 程 序 的 返回 会 中 断 这 
个 select 调 用 ， 使 得 它 返回 一 个 EINTR 错 误 。 为 处 理 这 种 情形 ， 我 们 的 
Select 包 裹 函数 检查 这 个 错误 ， 并 重新 调用 select， 如 图 D-5 所 示 。 
































lib/wrapunix.c 





























313 int 
314 Select (int nfds, fd set *readfds, fd set *writefds, fd set *exceptfds, 
315 struct timeval *timeout) 
316 ( 
317 int n; 
318 again: 
319 if ( (n = select(nfds, readfds, writefds, exceptfds, timeout)) < O)( 
320 if (errno -- EINTR) 
图 D-5 处 理 EINTR 的 Select 包 于 函数 
321 goto again; 
322 else 
323 err_sys("select error") ; 
324 } else if (n == 0 && timeout == NULL) 
325 err_quit ("select returned 0 with no timeout"); 
326 return (n); /* can return 0 on timeout */ 
327 } 
lib/wrapunix.c 
图 D-5 (5D 
A^ a} ` NR ` Y. Y N vA 
UNPv1 第 124 页 [4] 有 关于 被 中 断 系 统 调用 的 详细 讨论 。 
A^ nor. 
ROT 


6.1 其 余 程序 必须 接受 数值 形式 的 消 轧 队列 标识 符 ， 而 不 是 路 径 名 
《回想 一 下 图 6-3 中 程序 的 输出 ) 。 这 些 程序 上 的 如 此 变动 既 可 通过 增 
设 一 个 新 的 命令 行 选项 做 到 ， 也 可 假设 完全 为 数值 的 路 径 名 参数 是 标识 
符 而 不 是 真 的 路 径 名 。 既 然 传递 给 ftok 的 多 数 路 径 名 是 绝对 路 径 名 而 不 
是 相对 路 径 名 也 束 是 说 它们 至 少 包 含 一 个 和 斜 杠 符 〉，， 这 样 的 假设 也 许 
可 行 。 

6.2 类 型 为 0 的 消息 是 不 被 允许 的 ， 而 客户 是 决 不 可 能 有 1 这 个 进程 
ID 的 ， 因 为 它 通 常 是 init 进 程 的 进程 ID。 

6.3 ” 当 如 图 6-14 所 示 只 使 用 一 个 队列 时 ， 这 个 恶意 的 客户 影响 所 有 
其 他 客户 。 当 给 每 个 客户 准备 一 个 返 送 队 列 时 《图 6-19) ， 这 个 客户 只 
能 影响 它 自 己 的 队列 。 

DAS 

7.2 进程 将 终止 ， 而 且 可 能 是 在 消费 者 线程 完成 之 前 ， 因 为 调用 exit 





将 终止 任何 仍 在 运行 中 的 线程 。 

7.3 Solaris 2.6 F, @l%destroyes ACH 3] H e SP ils, HerzriniteR 
数 是 在 执行 动态 内 存 分 配 。 在 Digital Unix 4.0B 下 ， 我 们 没有 看 到 这 种 现 
象 ， 这 意味 着 实现 上 存在 差异 。 

不 过 调用 匹配 的 destroy 函 数 仍 是 需要 的 。 从 实现 的 角度 看 ，Digital 
Unix 像 是 把 attr_t 变 量 用 作 属 性 对 象 本 映 ，Solaris 则 把 该 变量 用 作 指 同 动 
态 分 配对 象 的 指针 。 这 两 种 实现 都 是 可 行 的 。 

第 9 章 

9.1 你 可 能 需要 把 原来 为 20 的 循环 计数 加 大 才能 看 到 这 些 错 误 ， 这 
取决 于 你 的 系统 。 

9.2 要 使 标准 WO 流 不 缓冲 ， 我 们 在 main 函 数 的 for 循 环 之 前 插入 如 下 








/一 


ÎT: 

setvbuf(stdout, NULL, IONBF,0); 

这 么 修改 不 应 该 有 任何 效果 ， 因 为 printf 调 用 只 有 一 个 ， 而 且 所 输 
出 字符 串 是 以 换行 人 符 结尾 的 。 通 常情 况 下 ， 标 准 输出 是 行 缓冲 的 ， 因 此 
不 论 哪 种 缓冲 方式 〔 行 缓冲 或 不 绥 冲 ) ， 这 个 单独 的 printf 调 用 最 终 变 
为 对 内 核 的 单个 write 调 用 。 

9.3 我 们 把 printf 调 用 改 为 : 

snprintf(line,sizeof(line),"%s: pid = %ld,seq# = %d\n", 





argv[0],(long)pid,seqno); 
for (ptr = line; (c = *ptr++)!= 0; ) 
putchar(c); 

并 声明 c 是 一 个 整数 ，ptr 的 类 型 为 char *。 保 留 上 一 道 习题 所 加 的 
setvbuf 调 用 不 变 ， 从 而 使 得 标准 输出 变 为 不 缓冲 ， 于 是 标准 1/O 函 数 库 
给 所 输出 的 每 个 字符 调用 一 次 write， 而 不 是 每 行 调用 一 次 。 这 么 一 来 需 
要 更 多 的 CPU 时 间 ， 内 核 在 两 个 进程 之 间 来 回 切换 的 机 会 也 增多 。 我 们 
应 该 从 这 个 程序 的 运行 中 看 到 更 多 的 错误 。 


9.4. 既然 对 于 一 个 文件 的 同一 区 段 允 许多 个 进程 有 读 出 锁 ， 那 么 束 
我 们 的 例子 而 言 ， 这 与 没有 任何 锁 是 一 样 的 。 

95 ”没有 任何 变化 ， 因 为 一 个 撞 述 符 的 非 阻 具 标 志 对 于 fcntl 劝 告 性 
上 锁 没 有 影响 。 决 定 fentl 调 用 是 否 阻 窄 的 是 其 命令 : FE_SETLKW 表 明 总 
是 阻塞 ，F_SETLK 则 表明 永 不 阻塞 。 

9.6 loopfcntinonb 程 序 运 行 如常 ， 因 为 我 们 已 在 上 一 道 习题 展 示 ， 非 
阻塞 标志 对 于 执行 fcntL 上 锁 的 程序 没有 影响 。 然 而 非 阻塞 标志 确实 影 啊 
不 执行 上 锁 的 loopnonenonb 程 序 。 我 们 在 9.5 节 说 过 ， 如 果 对 启用 了 强制 
性 上 锁 的 文件 所 进行 的 read 或 write 非 阻塞 调用 与 已 有 的 锁 发 生 冲 突 ， 那 
么 会 返回 一 个 EAGAIN 错 误 。 我 们 看 到 的 这 个 错误 或 者 是 

read error: Resource temporarily unavailable 

或 者 是 

write error: Resource temporarily unavailable 

通过 执行 如 下 命令 就 能 验证 这 个 错误 是 EAGAIN: 

solaris % grep Resource /usr/include/sys/errno.h 

#define EAGAIN 11 /* Resource temporarily unavailable */ 

9.7 Solaris 2.6 下 ， 强 制 性 上 锁 增 加 了 约 16% 的 时 钟 时 间 和 约 20% 的 
系统 CPU 时 间 。 用 户 CPU 时 间 保 持 不 变 ， 正 如 我 们 所 预期 的 那样 ， 这 是 
因为 额外 的 时 间 花 在 了 内 核对 每 个 read 和 write 调 用 的 检查 上 ， 而 不 是 在 
HPE. 

9.8 锁 是 以 每 个 进程 为 基 而 不 是 以 每 个 线程 为 基 授 予 的 。 要 看 到 上 
锁 请 求 的 竞争 现象 ， 我 们 必须 让 不 同 的 进程 来 答 试 获取 锁 。 

9.9 如 果 本 守护 进程 的 另 一 个 副本 正在 运行 ， 当 使 用 O_TRUNC 标 志 
open 时 ， 由 本 守护 进程 的 第 一 个 副本 存放 的 进程 ID 就 会 被 冲 掉 。 我 们 只 
有 获悉 自己 是 唯一 在 运行 的 副本 后 ， 才 能 截 掉 文件 内 容 。 

9.10 SEEK_SET 总 是 最 可 取 的 。SEEK_CUR 的 问题 是 它 取决 于 文件 
中 的 当前 侦 移 量 ， 而 该 值 是 由 lseek 指 定 的 。 但 是 如 果 在 调用 lseek 之 后 调 








用 fcnt， 那 么 我 们 是 在 使 用 两 个 函数 调用 完成 单个 操作 的 任务 ， 而 这 两 
个 函数 调用 之 间 存 在 由 男 外 一 个 线程 通过 调用 lseek 修 改 当 前 偏 移 量 的 机 
会 。《〈 回 想 一 下 所 有 线程 共享 相同 的 描述 符 。 另 外 回想 一 下 fcntl 记 录 锁 
用 于 不 同 进程 之 间 的 上 锁 ， 而 不 是 单个 进程 内 的 不 同 线程 之 间 的 上 
锁 。) 同样 ， 如 果 我 们 指定 SEEK_END， 那 么 在 基于 所 认定 的 文件 尾 获 
得 一 个 锁 之 前 ， 另 外 一 个 线程 有 可 能 已 往 该 文件 添加 数据 。 
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10.1 以 下 是 在 Solaris 2.6 下 的 结果 输出 : 

solaris % deadlock 100 

prod: calling sem_wait(nempty) 生产 者 i=0 时 的 循环 


prod: got sem_wait(nempty) 








prod: calling sem_wait(mutex) 

prod: got sem_wait(mutex),storing 0 

prod: calling sem_wait(nempty) 生产 者 i=1 时 的 循环 

prod: got sem_wait(nempty) 

prod: calling sem_wait(mutex) 

prod: got sem_wait(mutex),storing 1 

prod: calling sem_wait(nempty) 开始 下 一 轮 循环 ， 但 
RA er. 

上 下 文 从 生产 者 切换 到 消费 者 

cons: calling sem_wait(mutex) 消费 者 i=0 时 的 循环 

cons: got sem_wait(mutex) 

cons: calling sem_wait(nstored) 

cons: got sem_wait(nstored) 

cons: fetched 0 

cons: calling sem_wait(mutex) iH SEI LENT ES RR 


cons: got sem wait(mutex) 


cons: calling sem_wait(nstored) 

cons: got sem_wait(nstored) 

cons: fetched 1 

cons: calling sem_wait(mutex) 

cons: got sem_wait(mutex) 

cons: calling sem_wait(nstored) 消费 者 永远 阻塞 于 此 

上 下 文 从 消费 者 切换 到 生产 者 

prod: got sem_wait(nempty) 

prod: calling sem wait(mutex) 生产 者 永远 阻塞 于 
此 

10.2 在 我 们 描述 sem_open 时 指定 了 信和 号 量 初始 化 规则 的 前 提 下 ， 这 
是 可 行 的。 该 规则 说 ， 如 果 信 号 量 已 经 存在 ， 它 就 不 被 初始 化 。 因 此 这 
4 个 进程 中 ， 只 有 第 一 个 调用 sem_open 的 进程 才 真 正 把 信号 量 的 值 初始 
化 为 1。 当 其 余 3 个 进程 以 O_CREAT 标 志 调 用 sem_open 时 ， 所 需 信 号 量 
己 经 存在 ， 其 值 于 是 不 再 被 初始 化 。 

10.3 这 确实 是 个 问题 。 信 和 号 量 在 该 进程 终止 时 被 自动 关闭 ， 但 是 其 
值 并 没有 改变 。 这 将 妨碍 其 他 3 个 进程 中 的 任何 一 个 取得 所 需 的 锁 ， 从 
而 导致 男 外 一 种 类 型 的 死 锁 。 

10.4 要 是 我 们 没有 把 这 两 个 描述 符 初 始 化 为 -1， 那 么 它们 的 初始 值 
是 不 确定 的 ， 因 为 malloc 并 不 对 它 分 配 的 内 存 进行 初始 化 。 这 么 一 来 ， 
如 果 有 一 个 open 调 用 失败 ，error 标 号 处 的 close 调 用 融 可 能 关闭 该 进程 正 
在 使 用 的 茶 个 描述 符 。 把 擅 述 符 初 始 化 为 -1 后 ， 我 们 可 知 如 果 描 述 符 尚 
未 被 打开 则 close 调 用 不 会 有 什么 后 果 《 除 返回 一 个 我 们 忽略 掉 的 错误 
ee 

10.5 尽管 很 小 ， 却 存在 这 样 的 机 会 : close 调 用 虽然 针对 一 个 有 效 的 
描述 符 ， 但 仍 可 能 返回 菜 个 错误 ， 从 而 把 errno 由 我 们 想 返 回 的 值 改 为 其 
他 值 。 既 然 我 们 想 要 保存 errno 值 以 返回 给 调用 者 ， 显 式 地 去 做 总 比 依赖 














某 些 副作用 《例如 当 关 闭 的 是 一 个 有 效 的 描述 符 时 ，close 调 用 不 会 返回 
错误 ) 来 得 好 。 

10.6 这 个 函数 中 不 存在 竞争 状态 ， 因 为 如 果 所 需 的 FIFO 已 经 存在 ， 
mkfifo 冰 数 将 返回 一 个 错误 。 如 果 有 两 个 进程 几乎 同时 调用 这 个 函数 ， 
那么 相应 的 FIFO 只 创建 一 次 。 调 用 mkfifo 的 第 二 个 进程 将 收 到 一 个 
EEXIST 错 误 ， 导 致 O_ CREAT 标 志 被 关 掉 ， 从 而 防止 再 次 初始 化 同一 个 
FIFO。 

10.7 图 10-37 没 有 我 们 随 图 10-43 描 述 的 竞争 状态 ， 因 为 其 信号 量 的 
初始 化 是 通过 写 数据 到 相应 的 FIFO 完 成 的 。 如 果 创建 该 FIFO 的 进程 在 
调用 mkfifo 之 后 但 在 癌 该 FIFO write 数据 字 节 之 前 被 内 核 挂 起 ， 那 么 第 二 
个 进程 只 是 打开 该 FIFO， 随 后 在 首次 调用 sem_wait 处 阻塞 ， 因 为 这 个 新 
创建 的 FIFO 在 第 一 个 进程 〈( 即 创建 该 FIFO 的 进程 ) 往 它 写 数据 字 节 前 
一 直 为 空 。 

10.8 图 D-6 给 出 了 该 测试 程序 。Solaris 2.6 和 Digital Unix 4.0B 上 的 实 
现 都 检测 被 某 个 捕获 的 

言 号 中 断 的 情况 ， 并 返回 EINTR 错 误 。 





pxsem/testeintr.c 





1 #include "unpipc.h" 
2 #define NAME "testeintr" 


3 static void sig alrm(int); 


4 int 

5 main(int argc, char **argv) 

6 { 

7 sem t *seml, sem2; 

8 /* first test a named semaphore */ 
9 sem unlink(Px ipc name (NAME) ) ; 

10 seml = Sem open(Px ipc name(NAME), O_RDWR | O CREAT | O EXCL, 
11 FILE MODE, 0); 

12 Signal (SIGALRM, sig alrm); 

13 alarm(2) ; 

14 if (sem wait(seml) == 0) 

15 printf ("sem wait returned 0?Wn"); 
16 else 

17 err ret("sem wait error"); 

18 Sem close (seml); 

19 /* now a memory-based semaphore with process scope */ 
20 Sem init(&sem2, 1, 0); 

21 alarm(2); 

22 if (sem wait(&sem2) -- 0) 

93 printf ("sem wait returned 0?\n") ; 
24 else 

25 err ret("sem wait error"); 

26 Sem destroy (&sem2); 

27 exit (0) ; 

28 } 


29 static void 
30 sig alrm(int signo) 


3t { 

32 printf ("SIGALRM caught Mn"); 
33 return; 

34 ) 


pxsem/testeintr.c 





图 D-6 测试 sem_wait 是 否 返 回 EINTR 


我 们 使 用 FIFO 的 实现 会 返回 EINTR， 因 为 seam_wait 阻 塞 在 对 于 一 个 
FIFO 的 某 个 read 调 用 中 ， 而 read 调 用 必须 返回 EINTR 错 误 。 我 们 使 用 内 
存 映 射 UO 的 实现 不 返回 任何 错误 ， 因 为 sem_wait 阻 塞 在 某 个 
pthread_cond_wait 调 用 中 ， 而 该 函数 被 一 个 捕获 的 信号 中 断 时 并 不 返回 
EINTR. 我 们 在 图 5-29 中 看 到 过 另外 一 个 例子 。) 我 们 使 用 System V 

言 号 量 的 实现 返回 EINTR， 因 为 sm_wait 阻 塞 在 某 个 semop 调 用 中 ， 而 
semop 调 用 返回 EINTR 错 误 。 














10.9 ”使 用 FIFO 的 实现 (图 10-40) 是 异步 信号 安全 的 ， 因 为 write 是 
异步 信号 安全 的 。 使 用 内 存 映 射 文件 的 实现 (图 10-47〉 则 不 是 ， 因 为 
没有 一 个 pthread XXX 函数 是 异步 信号 安全 的 。 使 用 System V 信 和 号 量 的 
实现 (图 10-56〉 也 不 是 ， 因 为 Unix 98 没 有 把 semop 列 为 异步 信号 安全 函 
数 。 
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11.1 只 需 修改 其 中 一 行 : 

< semid = Semget(Ftok(argv[optind |,0),0,0); 








> semid = atol(argv[optind]); 

11.2 ftok 调 用 将 失败 ， 从 而 导致 我 们 的 Ftok 包 于 函数 的 终止 。 
my_lock 函 数 可 在 调用 semget 之 前 调用 ftok， 检 查 是 人 否 返 回 ENOENT 错 
误 ， 若 LOCK_PATH 文 件 不 存在 则 创建 它 。 
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12.1 文件 大 小 将 再 增长 4 096 字 市 (达到 36 8647675) ， 最 后 一 个 
printf 对 新 文件 结束 符 〈ptr 字 符 数 组 的 对 应 下 标 为 36863) 所 作 的 引用 可 
能 引发 SIGSEGV 信 和 号， 因为 内 存 映 射 区 的 大 小 为 32 768 字 节 。 我 们 
说 “可 能 ”而 不 是 “将 ”的 原因 在 于 ， 该 信号 产生 与 否 取决 于 页 面 大 小 。 

12.2 图 D-7 是 使 用 System V 消 息 队 列 发 送 消息 的 示意 图 ， 图 D-8 是 使 
用 通过 mmap 实 现 的 Posix 消 息 队 列 发 送 消息 的 示意 图 。 图 D-8 中 发 送 者 
的 memcpy 发 生 在 调用 mq_send 期 间 〈 图 5-30) ， 接 收 者 的 memcpy 则 发 
生 在 调用 mq_receive 期 间 (图 5-32) 。 


















msgsnd ( ) 





接收 者 
进程 内 核 


System V 
消息 队列 





图 D-7 使 用 System V 消 息 队 列 发 送 消息 


"Pg memcpy () 共享 内 存 中 的 
接收 者 Posix 消 息 队 列 











内 核 的 虚 存 算 法 保持 普通 
文件 与 内 存 映射 区 同步 


图 D-8 使 用 通过 mmap 实 现 的 Posix 消 息 队 列 发 送 消息 
12.3 ”对 /dev/zero 设 备 文 件 的 任何 read， 所 返回 的 是 所 请 求 数 目的 全 
为 0 的 字 节 。write 到 该 设备 的 任何 数据 被 直接 丢弃 掉 ， 就 像 write 
到 /devnull 设 备 一 样 。 
12.4 该 文件 的 最 终 内 容 为 4 字 市 的 0 (假设 int 类 型 为 32 位 〉。 
12.5 图 D-9 给 出 了 我 们 的 程序 。 














1 #include "unpipc.h" 
2 #define MAXMSG (8192 + sizeof (long)) 


3 int 


4 main(int argc, char **argv) 


5 { 


i:00 Vv 


int pipel[2], pipe2[2], mqid; 
char es 

pid t  childpid; 

fd set rset; 

Ssize t n, nread; 

struct msgbuf *buff; 


if (argc != 2) 
err quit("usage: svmsgread <pathname>") ; 


Pipe (pipel); /* 2-way communication with child */ 
Pipe (pipe2) ; 
buff = My shm(MAXMSG) ; /* anonymous shared memory with child */ 
if ( (childpid = Fork()) == 0) { 

Close (pipel [1] ) ; /* child */ 


Close (pipe2 [0] ) ; 


mqid = Msgget(Ftok(argv[1], 0), MSG R); 
for ( ¢ 7 i { 
/* block, waiting for message, then tell parent */ 
nread = Msgrcv(mqid, buff, MAXMSG, 0, 0); 
Write (pipe2[1], &nread, sizeof (ssize_t)); 


/* wait for parent to say shm is available */ 
if ( (n = Read(pipel[0], &c, 1)) != 1) 
err quit("child: read on pipe returned %d", n); 
} 
exit (0); 
} 
/* parent */ 
Close (pipel [0] ) ; 
Close (pipe2 [1] ) ; 


FD ZERO(&rset); 
FD SET(pipe2[0], &rset); 
for Cz si 
if ( (n = select(pipe2[0] + 1, &rset, NULL, NULL, NULL)) !- 1) 
err sys("select returned $d", n); 
if (FD ISSET(pipe2[0], &rset)) { 
n - Read(pipe2[0], &nread, sizeof(ssize t)); 
if (n != sizeof(ssize t)) 
err quit("parent: read on pipe returned $d", n); 
printf ("read $d bytes, type = %ld\n", nread, buff-»mtype); 
Write(pipel[1], &c, 1); 
) eise 
err quit("pipe2[0] not ready"); 
) 
Kill(childpid, SIGTERM); 
exit (0); 





shm/svmsgread.c 


shm/svmsgread.c 





图 D-9 父子 进程 设置 成 对 System V 消 息 使 用 select 的 例子 
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13.1 图 D-10 给 出 了 图 12-16 的 修改 后 版 本 ， 图 D-11 给 出 了 图 12-19 的 
修改 后 版 本 。 注 意 在 第 一 个 程序 中 ， 我 们 必须 使 用 ftruncate 设 置 共享 内 
存 对 象 的 大 小 ， 而 不 能 使 用 lseek 和 write。 











1 #include "unpipc.h" 
2 ant 
3 main(int argc, char **argv) 
= 4 
5 int fd, md 
6 char *ptr; 
7 size t shmsize, mmapsize, pagesize; 
8 if (argc !- 4) 
9 err quit("usage: testl «name» «shmsize» «mmapsize»"); 
10 shmsize = atoi(argv[2]); 
T3: mmapsize = atoi(argv[3]); 
12 /* open shm: create or truncate; set shm size */ 
13 fd = Shm open(Px ipc name(argv[1]), O_RDWR | O CREAT | O TRUNC, 
14 FILE MODE); 
15 Ftruncate(fd, shmsize); 
16 ptr-Mmap(NULL, mmapsize, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
Tu Close (fd) ; 
18 pagesize = Sysconf( SC PAGESIZE); 
19 printf("PAGESIZE = %ld\n", (long) pagesize); 
20 for (i = 0; i < max(shmsize, mmapsize); i += pagesize) { 
21 printf("ptr[$d] = ydyn", i, ptrli]); 
22 PER = 1; 
23 printf ("ptr[%d] = $dWMn", i + pagesize - 1,ptr[i + pagesize - 1]); 
24 ptr[i + pagesize - 1] = 1; 
25 } 
26 printf ("ptr[%d] = %d\n", i, ptr[il); 
gd exit (0); 
28 } 
图 D-10 访问 其 大 小 可 能 不 同 于 共享 内 存 区 大 小 的 mmap 
1 #include "unpipc.h" 
2 #define FILE "test.data" 
3 #define SIZE 32768 
4 int 
5 main(int argc, char **argv) 
6 { 
9g int fd, i; 
8 char *ptr; 
9 /* open shm: create or truncate; then mmap shm */ 
10 fd-Shm open(Px ipc name(FILE),O RDWR|O CREAT|O TRUNC, FILE MODE); 
T1 ptr - Mmap(NULL, SIZE, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 


pxshm/testl.c 


pxshm/testl.c 


pxshm/test2.c 





图 D-11 允许 共享 内 存 区 大 小 增长 的 内 存 映 射 例子 





12 for (i - 4096; i «- SIZE; i «- 4096) ( 


13 printf ("setting shm size to %d\n", i); 
14 Ftruncate (fd, i); 

15 printf ("ptr[%d] = $dWMn", i-1, ptr[i-1]); 
16 

17 exit (0); 


18 ) 
pxshm/test2.c 





KID-11 CD 


13.2. *ptre- Hf BE T£ CERIS] H eZ — 3i Fo mmapoR NSE, M 
而 妨碍 以 后 调用 munmap 。 

如 果 以 后 要 用 到 该 指针 ， 我 们 就 得 把 它 保存 起 来 ， 或 者 不 作 修改 。 
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14.1 只 有 一 行 需要 改动 : 
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13c13 

< id = Shmget(Ftok(argv[1],0),0,SVSHM, MODE);--- 

> id = atol(argv[1]); 

15.1 这 样 的 参数 的 字 节 数 为 data_size+ 
(desc num*sizeof(door desc t)). 

15.2 ”没有 调用 fstat 的 必要 。 如 果 所 打开 的 描述 符 指 代 的 不 是 一 个 
门 ， 那 么 door_info 将 返回 一 个 EBADF 错 误 : 


solaris % doorinfo /etc/passwd 








door info error: Bad file number 

15.3 该 手册 页 面 是 错误 的 。Posix.1 对 此 的 正确 陈述 为 “The 
sleepOfunction shall cause the current thread to be suspended from 
execution.”(sleep 函 数 会 导致 当前 线程 从 执行 状态 挂 起 ) 。 

15.4 结 末 难以 预料 〈 尽 管 核心 转 储 是 一 个 相当 安全 的 猜测 ) ， 因 为 
与 其 中 的 门 相 关联 的 服务 器 过 程 的 地 址 会 导致 在 新 执行 的 程序 中 ， 某 段 
随机 的 代码 会 被 作为 一 个 函数 来 调用 。 





15.5 当 客 户 的 door_call 被 所 捕获 的 信号 中 断 时 ， 服 务 器 进程 必须 被 
通知 到 ， 因 为 它 需 随后 向 处 理 该 客户 的 服务 器 线程 〈 它 的 ID 在 我 们 的 输 
出 例子 中 为 4) 发 送 一 个 取消 请 求 ， 然 而 我 们 随 图 15-23 说 过 ， 对 于 由 门 
函数 库 自 动 创 建 的 所 有 服务 器 线程 来 说 ， 取 消 操作 是 被 禁止 的 ， 我 们 正 
讨论 的 线程 于 是 不 会 因 取消 而 终止 。 相 反 ， 当 客户 的 door_call 被 终止 
时 ， 服 务 器 过 程 阻塞 在 其 上 的 sleep(6) 调 用 看 来 在 该 过 程 被 调用 后 约 2 秒 
钟 就 过 早 地 返回 了 。 但 是 执行 该 过 程 的 服务 器 线程 仍 持续 运行 到 完成 为 
i 

15.6 我 们 看 到 的 错误 如 下 : 


solaris % server6 /tmp/door6 





my_thread: created server thread 4 
door_bind error: Bad file number 
当 我 们 连续 启动 该 服务 器 20 次 时 ， 该 错误 出 现 了 5 次 。 该 错误 是 不 


确定 的 。 
15.7 不 需要 。 我 们 需 做 的 只 是 如 图 15-31 中 那样 ， 每 次 服务 器 过 程 
AE HH SY ta ALB 


这 种 技术 尽管 在 服务 器 过 程 每 次 被 激活 时 都 要 调用 
pthread_setcancelstate， 而 不 是 仅 在 执行 该 过 程 的 线程 启动 时 调用 一 次 ， 
但 其 开销 却 可 能 很 小 。 

15.8 为 验证 这 一 点 ， 我 们 将 茶 个 服务 器 程序 〈 璧 如 说 图 15-9) 改 为 
从 服务 器 过 程 中 调用 door_revoke。 由 于 门 描述 符 是 door_revoke 的 参数 ， 
因此 我 们 还 得 把 fd 改 成 一 个 全 局 变量 。 我 们 随后 执行 相应 的 客户 程序 

( 壁 如 说 图 15-2〉 两 次 : 

solaris % client8 /tmp/door8 88 

result: 7744 

solaris % client8 /tmp/door8 99 


door_call error: Bad file number 


第 一 次 激活 服务 器 过 程 成 功 返 回 ， 从 而 证 实 door_revoke 不 影响 已 在 
进行 的 调用 。 第 二 次 激活 告知 从 door_call 返 回 的 错误 是 EBADF。 

15.9 为 避免 使 fd 成 为 一 个 全 局 变量 ， 我 们 使 用 传递 给 door_create 的 
cookie 指 针 ， 该 指针 随后 在 服务 器 过 程 每 次 被 调用 时 传递 给 它 。 图 D-12 
给 出 了 服务 器 程序 。 


doors/server9.c 





1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

一 door desc t *descptr, size t ndesc) 

5 { 

6 long arg, result; 

7 Door revoke (*((int *) cookie) ) ; 

8 arg = *((long *) dataptr) ; 

9 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
10 result = arg * arg; 

1A Door_return((char *) &result, sizeof (result), NULL, 0); 
12: } 

13 int 

14 main(int argc, char **argv) 

15 { 

16 int fd; 

17 if (arge !- 2) 

18 err quit("usage: server9 <server-pathname>") ; 

19 /* create a door descriptor and attach to pathname */ 
20 fd - Door create(servproc, &fd, 0); 
24. unlink (argv [1]) ; 
22 Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 
23 Fattach(fd, argv[1]1); 
24 /* servproc() handles all client requests */ 
25 for Cw) 
26 pause() ; 
2. uk 


doors/server9.c 








图 D-12 使 用 cookie 指 针 以 避免 使 fd 成 为 一 个 全 局 变量 


我 们 可 以 很 容易 地 对 图 15-22 和 图 15-23 作 同样 的 修改 ， 因 为 cookie 
指针 对 我 们 的 my_create 隙 数 而 言 是 可 得 的 (该 指针 在 door_info_t 结 构 
中 ) ， 而 该 函数 又 把 指 癌 该 结构 的 指针 传递 给 新 创建 的 线程 ( 它 需 要 对 
应 door_bind 调 用 的 描述 符 ) 。 

15.10 本 例 中 线程 属性 从 不 改变 ， 因 此 我 们 可 以 只 初始 化 一 次 线程 
属性 《在 main 函 数 中 完成 ) 。 

















第 16 章 

16.1 端口 映射 右 并 不 监视 已 癌 它 注册 的 各 个 服务 器 ， 因 而 无 法 检测 
它们 是 否 有 骨 尝 。 终 止 其 中 某 个 服务 器 后 ， 它 在 端口 映射 器 中 注册 的 映射 
关系 并 不 注销 ， 这 一 点 可 使 用 rpcinfo 程 序 来 验证 。 这 么 一 来 ， 该 服务 器 
终止 后 ， 与 端口 映射 器 联系 以 获取 该 服务 器 端口 号 的 某 个 客户 将 得 到 肯 
定 的 答复 ， 由 端口 映射 器 返回 该 服务 器 在 终止 之 前 使 用 的 端口 号 。 假 设 
该 服务 器 是 一 个 TCP 服 务 器 ， 当 该 客户 试图 与 它 联系 时 ， 客 户 方 RPC 运 
行 时 环境 将 收 到 RST( 复 位 〉 分 节 作为 对 SYN 分 市 的 啊 应 (前 提 是 自 该 
服务 器 终止 以 来 ， 服 务 器 主机 上 没有 其 他 进程 被 赋予 同样 的 端口 ) ， 从 
而 导致 从 clnt_create 返 回 一 个 错误 。UDP 客 户 调用 clnt_create 将 成 功 〈 因 
为 没有 连接 需要 建立 ) 。 但 是 当 它 问 以 前 的 服务 器 端口 发 送 UDP 数 据 报 
时 ， 什 么 应 答 都 不 会 返回 (同样 假设 自 该 服务 器 终止 以 来 ， 服 务 器 主机 
上 没有 其 他 进程 被 赋予 同样 的 端口 ) ， 该 客户 的 远程 过 程 调用 最 终 将 超 
时 。 

16.2 当 收 到 服务 器 的 第 一 个 应 答 后 ，RPC 运 行 时 环境 把 它 返 回 给 客 
户 ， 这 发 生 在 客户 发 出 远程 过 程 调 用 后 约 20 秒 。 因 超时 重 传导 致 的 服务 
器 的 下 一 个 应 管 将 一 直 存 留 在 客户 方 端点 的 网 络 缓冲 区 中 ， 直 到 该 端点 
被 天 闭 ， 或 者 直到 RPC 运 行 时 环境 下 一 次 读 该 缓冲 区 为 止 。 现 在 假设 客 
户 在 收 到 第 一 个 应 答 后 立即 同 服 务 器 再 次 发 出 调用 [5] ， 再 假设 没有 网 
络 分 组 丢失 现象 ， 下 一 个 到 达 客 户 方 端点 的 数据 报 将 是 服务 器 对 于 客户 
的 超时 重 传 的 应 答 。 然 而 RPC 运 行 时 环境 将 忽略 这 个 应 答 ， 因 为 它 的 
XID 对 应 于 客户 的 第 一 次 远程 过 程 调用 ， 它 不 可 能 与 客户 的 第 二 次 过 程 
调用 所 用 的 XID 相 同 。 

16.3 构造 一 个 成 员 为 char c[10] 的 C 结 构 ， 不 过 XDR 将 把 它 编码 成 10 
个 4 字 市 整数 。 要 是 你 确实 需要 定 长 的 字符 串 ， 那 就 使 用 定 长 的 不 透明 
数据 类 型 。 

16.4 xdr_data 调 用 返回 FALSE， 因 为 它 的 xdr_string 调 用 返回 

















FALSE (参见 data_xdr.c 文 件 )。 

当 指 定 一 个 最 大 长 上 度 时 ， 它 将 作为 xdr_string 的 最 后 一 个 参数 编码 。 
当 省 略 这 个 最 大 长 度 时 ， 最 后 一 个 参数 是 0 的 反 码 (在 32 位 整数 前 提 
TFT. REA) 

16.5 所 有 的 XDR 例 程 都 检查 缓冲 区 中 是 否 有 足够 的 空间 以 存放 将 编 
码 到 其 中 的 数据 ， 当 缓冲 区 满 时 返回 FALSE 错 误 。 不 幸 的 是 ， 没 有 办 法 
区 别 来 自 XDR 函 数 的 各 种 不 同 的 可 能 错误 。 

16.6 我 们 可 以 说 TCP 使 用 序列 号 检测 重复 数据 在 效果 上 等 同 于 重复 
请 求 高 速 缓存 ， 因 为 对 于 作为 含有 TCP 已 确认 过 的 重复 数据 而 到 达 的 任 
何 旧 分 节 ， 这 些 序 列 号 都 能 将 其 标识 出 来 。 对 于 一 个 给 定 的 连接 (例如 

-个 给 定 客户 的 IP 地 址 和 端口 ) ， 该 高 速 缓存 的 大 小 是 TCP 的 32 位 序列 
号 空间 的 一 半 ， 也 就 是 231 或 约 2G 字 节 。 

16.7 ”由 于 对 一 个 给 定 的 请 求 来 说 ， 它 的 所 有 5 个 值 必须 等 于 某 个 高 
速 缓存 项 中 对 应 的 5 个 值 ， 因 此 第 一 个 作 比 较 的 值 应 该 是 最 可 能 不 等 的 
那个 值 ， 而 最 后 一 个 作 比较 的 值 应 该 是 最 可 能 相等 的 那个 值 。 在 TI-RPC 
软件 包 中 ， 真 正 的 比较 顺序 是 : (1) XID, (2) 过 程 号 ， G) 版 本 
5, (D 程序 号 ，(5) 客户 地 址 。 在 XID 随 每 个 请 求 变 化 的 前 提 下 ， 
首先 对 它 进 行 比 较 是 明智 的 。 

16.8 在 图 16-30 中 ， 从 标志 /长 度 字段 开始 ， 包 括 4 字 节 的 长 整数 过 程 
参数 在 内 ， 共 有 12 个 4 字 节 字段 ， 合 计 48 字 节 。 按 照 默 认 的 无 认证 配 
置 ， 和 凭证 数据 和 验证 器 数据 均 为 空 。 也 就 是 说 ， 和 凭证 和 验证 器 均 占 用 8 
字 节 : 4 字 节 指定 认证 方式 — CAUTH_NONE) ， 另 4 字 节 指定 认证 长 度 
《其 值 为 0) 。 

在 应 答 分 节 中 (看 图 16-32， 但 要 意识 到 由 于 在 使 用 TCP， 因 此 在 
XID 之 前 有 一 个 4 字 节 的 标志 /长 度 字 段 ，， 共 有 8 个 4 字 节 字段 ， 从 标志 / 
长 度 字 段 开始 ， 到 4 字 节 的 长 整数 过 程 结 果 为 止 ， 共 计 32 字 节 。 






























































当 使 用 UDP 时 ， 请 求 和 应 答 的 唯一 变动 是 不 存在 4 字 节 的 标志 /长 度 
字段 。 因 此 请 求 的 大 小 为 44 字 节 ， 应 答 的 大 小 为 28 字 节 ， 这 一 点 可 使 用 
tcpdump 验 证 。 

16.9 可 以 。 不 论 在 客户 端 还 是 在 服务 器 端 ， 参 数 处 理 上 的 差异 都 局 
限于 主机 ， 而 与 穿越 网 络 的 分 组 无 和 天。 客户 的 main 函 数 调用 客户 存根 中 
的 某 个 函数 以 产生 一 个 网 络 记 录 ， 服 务 器 的 main 函 数 则 调用 服务 器 存根 
中 的 菜 个 函数 处 理 这 个 网 络 记录 。 跨 越 网 络 传送 的 RPC 记 录 是 由 RPC 协 
议定 义 的 ， 而 RPC 协 议 不 论 客户 端 或 服务 右 喘 是否 文 持 线程 都 不 变 。 

16.10 XDR 运 行 时 环境 给 这 些 字 符 串 动态 分 配 字 间 。 给 read 程 序 增 
加 下 面 一 行 就 能 验证 这 个 事实 : 

printf("sbrkQ= %p,buff = 96p,in.vstring arg = %p\n", 

Sbrk(NULL),buff,in.vstring arg); 

其 中 sbtk 函 数 返 回 处 于 程序 数据 段 顶 部 的 当前 地 址 ， 而 在 此 以 下 的 
内 存 空间 通常 就 是 malloc 从 中 分 配 内 存 的 区 段 。 运 行 该 程序 产生 如 下 输 
出 : 

sbrk()= 29638,buff = 25e48,in.vstring_arg = 27e58 

它 表 明 指 针 vstring_arg 指 向 malloc 使 用 的 内 存 区 段 内 。8192 字 贡 的 
buff 地 址 为 0x25e48 一 0x27e47， 字 符 串 就 存放 在 该 缓冲 区 之 后 。 

16.11 图 D-13 给 出 了 客户 程序 。 注 意 clnt_call 的 最 后 一 个 参数 是 一 个 
真正 的 timeval 结 构 ， 而 不 是 指向 某 个 这 种 结构 的 指针 。 还 要 注意 
clnt_call 的 第 三 个 和 第 五 个 参数 必须 是 指向 XDR 例 程 的 非 空 函数 指针 ， 
因此 我 们 指定 的 是 不 做 任何 工作 的 XDR 函 数 xdr_ void。 【编写 一 个 很 小 
的 RPC 规 范文 件 ， 其 中 定义 一 个 既 没 有 参数 也 没有 返回 值 的 函数 ， 运 行 
rpcgen， 然 后 检查 所 生成 的 客户 存根 ， 这 样 你 就 能 验证 图 D-13 中 给 出 的 
确实 是 调用 一 个 既 没 有 参数 又 没有 返回 值 的 函数 的 方法 。) 


























sunrpc/square 10/client.c 


1 #include "unpipc.h" /* our header */ 

2 #include "square.h" /* generated by rpcgen */ 
3 int 

4 main(int argc, char **argv) 

5 

6 CLIENT *cl; 

7 struct timeval tv; 

8 if (argc !- 3) 

9 err quit("usage: client «hostname» «protocol»"); 
10 cl - Clnt create(argv[1], SQUARE PROG, SQUARE VERS, argv[2]); 
11 tv.tv sec - 10; 

T2 tv.tv_usec = 0; 

13 if (clnt_call(cl, NULLPROC, xdr_void, NULL, 

14 xdr_void, NULL, tv) != RPC_SUCCESS) 

15 err quit ("%s", clnt sperror(cl, argv[1])); 

16 exit (0); 

17 小 


sunrpc/square10/client.c 





图 D-13 调用 服务 器 空 过 程 的 客户 程序 
16.12 所 产生 的 UDP 数据 报 大 小 〈65536+20+RPC 开 销 ) 超过 了 IPv4 
数据 报 的 最 大 大 小 65535。 图 A-4 中 对 于 使 用 UDP 的 RPC 来 说 ， 不 存在 消 
恩 大 小 为 16384 和 32768 的 项 的 原因 是 ， 这 是 一 个 较 早 的 RPCSRC 4.03% 
现 ， 它 把 UDP 数 据 报 的 大 小 限制 在 约 9000 字 节 左 右 。 
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我 们 不 提供 一 个 单独 的 词汇 表 〈 其 中 大 多 数 条 目 将 是 首 字 母 缩 写 
词 ) ， 不 过 本 索引 也 可 用 作 本 书 所 用 所 有 首 字母 缩写 词 的 词汇 表 。 可 以 
首 字 母 缩 写 的 词 条 其 主 条 目 编排 在 缩写 词 之 下 。 举 例 来 说 ， 所 有 对 
Remote Procedure Call (远程 过 程 调 用 〉 的 引用 出 现在 RPC 之 下 ; 在 完 
整 词 条 “Remote Procedure Call* 之 下 的 条 目 只 是 引用 回 RPC 之 下 的 主 条 
目 。 

每 个 C 函 数 的 “definition of (XE X. ”条 目 给 出 该 函数 带 方 框 的 函数 
原型 即 基 本 描述 的 所 在 页 。 每 个 结构 的 “definition of GEM) ”条 目 给 出 
该 结构 的 基本 定义 的 所 在 页 。 那 些 在 本 书 中 有 源 代码 实现 的 函数 还 
有 “source code( 源 代码 ) ”条 目 。 

索引 中 的 页 码 为 喘 文 原 书页 码 ， 与 书 中 页 边 标 注 的 页 码 一 致 。 
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aio return function (aio_returnefi#) , 91 

aio suspend function (aio suspendPAZ) , 91 

AIX,151 

alarm function (alarmi ZI) , 91,396,425 

American National Standards Institute 〈 美 国 国家 标准 局 ) ， 见 ANSI 

American Standard Code for Information 

Interchange〈 美 国标 准 信 息 互 换代 码 ) ， 见 ASCII 

anonymous memory mapping 〈 匿 名 内 存 映 射 ) ，315-317 

ANSI (American National Standards Institute),21,402-403,505,511,520 

API (application program interface),13-14,356,379-380,450,536 

sockets 〈 套 接 字 API) ，8,14,151,398-399,403,406,449-450,454-455 
TLI, 406 

XTI, 14,151,398-399,403,406,413-414,424,449-450,455 

Apollo,406 

APUE (Advanced Programming in the UNIX Environment),536 

areply member (Careply 成 员 ) , 447 

arm (IX) , 429 

array datatype,XDR (XDR 数 组 数据 类 型 ) ，429 

array member (Carray 成 员 ) ，288 

ASCII (American Standard Code for Information 


Interchange), 193,426,429,444 

ASN.1 (Abstract Syntax Notation One),426 

Aspen Group,178 

asynchronous (异步 的 ) 

event notification (异步 事件 通知 )，87 

VO (#40) ，14,101 

procedure call (异步 过 程 调 用 ) , 356 

async-signal-safe (异步 信号 安全 ) , 90-91,95,98,102,279,525-526 

at-least-once RPC call semantics (最 少 一 次 RPC 调 用 语义 ) ， 
423,450 

at-most-once RPC call semantics (最 多 一 次 RPC 调 用 语义 ) ， 
423,450 

atomic (J FIN) , 24,59,197,214,220,286 

atomicity of pipe and FIFO writes〈 管 道 和 FIFO 写 操作 的 原子 性 ) ， 
65-66 

attributes (属性 ) 

condition variable (条 件 变 量 属性 ) ，113,172-174,521 

doors( 门 属性 ) ，363,366,375,384 

message queue (消息 队列 属性 ) ，79-82,520 

mutex〈 互 斥 锁 属 性 ) ，172-174 

process-shared〈 进 程 间 共享 的 属性 ) ，9- 
10,113,128,173,175,265,454 

read-write lock C5 UB PE) , 179 

thread (线程 属性 ) , 98,113,502,521,532 

aup_gid member (aup_gid 成 员 ) ，416 





aup_gids member (aup_gids 成 员 ) ，416 
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lock〔 锁 优先 级 )，180,207-213 

message queue 〈 消 息 队 列 优先 级 ) ，82-83,85-86,109， 

123-124,126,143,482 

thread 〈 线 程 优 先 级 ) ，160,502 

private server pool〈《 私 用 服务 器 池 ) , 386,388,390 

proc member (proc 成员) , 446 

PROC_UNAVAIL constant (PROC_UNAVAILL 种 值 ) 447-448 
procedure call (过 程 调用 ) 

asynchronous (异步 过 程 调 用 ) , 356 

local《〈 本 地 过 程 调用 ) ，355 

synchronous〈 同 步 过 程 调 用 ) ，356-357,476 

procedure,null 〈 空 过 程 ) ，451,486,534 

process HFE) 

lightweight《〈 轻 权 进 程 )》 501 


persistence〈 随 进程 的 持续 性 ) 6 
processes,cooperating 〈 协 作 进 程 ) ，203 
process-shared attribute (进程 间 共 享 的 属性 ) , 9- 
10,113,128,173,175,265,454 
producer-consumer problem 〈 生 产 者 一 消费 者 问题 ) ， 
161-165,233-238,242-249 
prog member (prog 成 员 ) ，446 
PROG_MISMATCH constant (PROG_MISMATCH 常 值 ) ，447-448 
PROG UNAVAIL constant (PROG UNAVAIL'$1H) , 447-448 
PROT EXEC constant (PROT_EXEC 常 值 ) 309 
PROT NONE constant (PROT NONE'$1H) , 309 
PROT READ constant (PROT_READ 常 值 ) 308-309 
PROT WRITE constant (PROT WRITE; [i) , 308-309 
ps program (ps 程序 ) , 127,175,367,452,520 
pselect function (pselect 函 数 ) , 171 
PTHREAD CANCEL constant (PTHREAD CANCEL'$1[H) , 188 
PTHREAD COND INITIALIZER 
constant (PTHREAD COND _INITIALIZER 常 值 ) 167,172 
PTHREAD MUTEX INITIALIZER 
constant (PTHREAD_MUTEX_INITIALIZER 常 值 ) 160,172 
Pthread_mutex_lock wrapper function,source code 
(Pthread_mutex_lock #3 rh BUR KAZ) , 12 
PTHREAD PROCESS PRIVATE 
constant (PTHREAD PROCESS PRIVATE? [H) , 173,179 
PTHREAD PROCESS SHARED 
constant (PTHREAD PROCESS SHARED'$ÍH) , 
113,128,173,179,193,239,256,265,462,497-498 





PTHREAD RWLOCK_INITIALIZER 

constant (PTHREAD RWLOCK INITIALIZER?$[H? , 178-179 
PTHREAD SCOPE PROCESS 

constant (PTHREAD_SCOPE_PROCESS ‘i [H) , 387 
PTHREAD SCOPE SYSTEM 

constant (PTHREAD SCOPE SYSTEM'[H) , 386,388 
pthread attr destroy function (pthread attr destroypA Zi) , 398 
pthread attr init function (pthread_attr_inite #0) , 398 
pthread attr t datatype 〈pthread_attr_t 数 据 类 型 ) , 502 
pthread cancel function (pthread cancelPÉ 2) , 187,190 
definition of (pthread_cancel 函 数 定 义 ) , 187 
pthread_cleanup_pop function (pthread_cleanup_popri#%) , 187,191 
definition of (pthread_cleanup_popefi27E X. , 187 


pthread_cleanup_push function (pthread_cleanup_pushesi 2) , 
187,396 
definition of (pthread_cleanup_push 函 数 定 义 ) , 187 


pthread condattr destroy function (pthread_ 

condattr destroyPA 20) , 175 

definition of (pthread condattr destroyPKZ;E X.) , 172 

pthread condattr getpshared function,definition of 

(pthread condattr getpsharedPA tE X.) , 173 

pthread  condattr init function 

(pthread condattr initPK Zi) , 114,175 

definition of (pthread condattr initP Zi iE X.) , 172 

pthread condattr setpshared function,definition of 
(pthread condattr setpsharedrKZizE X.) , 173 

pthread condattr t datatype (pthread condattr t% 2579) , 172 


pthread_cond_broadcast function 

Cpthread_cond_broadcast 函 数 ) ，171,175,186 

definition of (pthread_cond_broadcast 函 数 定 义 ) , 171 

pthread cond destroy function,definition of (pthread_cond_destroy rf 
OE XD , 172 

pthread cond init function,definition of (pthread_cond_initeé Zi «E 
MS), 172 

pthread cond signal function (pthread_cond_signal 函 数 ) ， 
124,126,167-171,175,186-187,227,268-269 

definition of (pthread_cond_signal 函 数 定义 ) , 167 

pthread_cond_t datatype 〈pthread_cond_t 数 据 类 型 ) , 8,167,256 

pthread_cond_timedwait function 

Cpthread_cond_timedwait 函 数 ) , 171 

definition of (pthread_cond_timedwait 函 数 定 义 ) , 171 

pthread cond wait ^ function (pthread_cond_wait 函 数 ) ，121,167- 
171,175,183-184,187,190-192,227,269,525 

definition of (pthread_cond_wait 函 数 定 义 ) , 167 

pthread_create function (pthread_create 函 数 ) , 163,217,356,385- 
388,502-504 

definition of (pthread_create žr X) , 502 

pthread_detach function (pthread_detach 函 数 ) , 502-504 

definition of (pthread_detach 函 数 定 义 ) , 504 

pthread exit function 〈pthread_exit 函 数 ) , 174,187,391,425,502-504 

definition of (pthread_exit 函 数 定 义 ) , 504 

pthread join function (pthread_join 函 数 ) ，357,387,502-504 

definition of (pthread_join 函 数 定 义 ) , 503 


pthread_mutexattr_destroy function (pthread_mutexattr_destroy Ff 


数 ) ，175 

definition of (pthread_mnutexattr_destroy 定 义 ) , 172 

pthread_mutexattr_getpshared function,definition of 
Cpthread_mutexattr_getpshared 函 数 定 义 ) , 173 

pthread_mutexattr_init function 〈pthread_mnutexattr_init 函 数 ) , 113- 
114,175,265 

definition of (pthread_mnutexattr_init 函 数 定 义 ) , 172 
pthread_mutexattr_setpshared function 

Cpthread_mutexattr_setpshared 函 数 ) , 113,265 

definition of (pthread_mutexattr_setpsharedefi žre X.) , 173 

pthread mutexattr t datatype (pthread_mnutexattr_t 数 据 类 型 ) , 172- 
173 

pthread_mutex_destroy function,definition of (pthread_mutex_destroy 
PREX, 172 

pthread_mutex_init function (pthread_mnutex_init 函 数 ) , 
113,160,172-173,265,498 

definition of (pthread_mnutex_init 函 数 定 义 ) , 172 

pthread_mutex_lock function (pthread_mutex_lockek 2) ， 
12,160,190,221 

definition of (pthread_mutex_lockeki št X.) , 160 

pthread mutex t datatype (pthread_mnutex_t 数 据 类 型 ) ， 
8,160,172,256,279 

pthread_mutex_trylock function (pthread_mutex_trylockréi Zt) , 160 

definition of (pthread_mnutex_trylock 函 数 定 义 ) , 160 

pthread mutex unlock function 〈pthread_mnutex_unlock 函 数 ) , 221 

definition of (pthread_mutex_unlock 函 数 定 义 ) ，160 


pthread_rwlockattr_destroy function,definition of 


Cpthread_rwlockattr_destroy 函 数 定 义 ) , 179 

pthread_rwlockattr_getpshared function,definition of 
Cpthread_rwlockattr_getpshared 函 数 定 义 ) , 179 

pthread rwlockattr init function,definition of (pthread_rwlockattr_init 
函数 定义 ) , 179 

pthread_rwlockattr_setpshared function,definition of 
(pthread_rwlockattr_setpshared ei iE X.) , 179 

pthread_rwlockattr_t datatype (pthread_rwlockattr_setpshared 数 据 类 
型 ) ，179 

pthread rwlock destroy function — (pthread rwlock destroyPA 20) ， 
179,181,192 

definition of (pthread_rwlock_destroy 函 数 定义 ) , 179 

source code (pthread_rwlock_destroy 函 数 源 代码 ) ，182 

pthread_rwlock.h header (pthread_rwlock.h 汰 文件 ) ，180 

pthread_rwlock_init function (pthread_rwlock_init 函 数 ) , 179,181 

definition of (pthread_rwlock_init 函 数 定义 ) , 179 

source code 〈pthread_rwlock_init 函 数 源 代 码 ) , 182 

pthread rwlock rdlock function — (pthread rwlock rdlockrAÉ24D , 
178-179,183,190-191 

definition of (pthread rwlock rdlockrEZizE X.) , 178 

source code (pthread_rwlock_rdlock esi BES) , 183 

pthread rwlock t datatype (pthread_rwlock_t 数 据 类 型 ) , 8,178,180- 
181,183,188,193,256 

pthread rwlock tryrdlock function (pthread_rwlock_tryrdlock ek 
数 ) , 184 

definition of (pthread_rwlock_tryrdlock 函 数 定 义 ) , 178 

source code (pthread_rwlock_tryrdlock 函 数 源 代码 ) , 184 


pthread_rwlock_trywrlock function (pthread_rwlock_trywrlocke&) 
数 ) , 184 

definition of (pthread_rwlock_trywrlock 函 数 定 义 ) , 178 

source code (pthread_rwlock_trywrlock 函 数 源 代码 ) , 185 

pthread_rwlock_unlock function 

(pthread rwlock unlockPK Z4) , 178-179,186,190,192 

definition of (pthread rwlock unlockrR Zi 4E X) , 178 

source code (pthread_rwlock_unlock 函 数 源 代码 ) , 186 

pthread_rwlock_wrlock function (pthread rwlock wrlockrÉ ZA) , 
178-179,183-184,190-191 

definition of (pthread_rwlock_wrlock 函 数 定义 ) , 178 

source code (pthread_rwlock_wrlock 函 数 源 代码 ) , 185 

pthread self function 〈pthread_self 函 数 ) , 502-504 

definition of (pthread_self 函 数 定义 ) , 503 

pthread_setcancelstate function 

(pthread setcancelstatePA| 2) , 396,530 

pthread setconcurrency function 

(pthread setconcurrencyPR 2) , 163 

pthread sigmask function (pthread sigmaskrÉ Zi) , 95 

pthread t datatype 〈pthread_sigmask 数 据 类 型 ) , 370-371,502 

<pthread.h> header (<pthread.h> 头 文件 ) , 180 

Pthreads,15 

putchar function (putchar žit) , 217 

PX IPC NAME environment variable (PX IPC NAME 环境 变 
tV 21 

px ipc name function (px ipc namePR Z4) , 21-22,26,78,235,505 
definition of (px ipc namer& Ze X.) , 21 


source code (px_ipc_namerki ží RIH) ，22 

quadruple datatype,XDR (XDR quadruple 数 据 类 型 ) , 427 

Quarterman,J.S.,311,536 

queued signals CHEM KA =) , 100,102 

FIFO order〔 排 队 的 信号 的 FIFO 顺 序 ) ，100,102,104-105 

raise function (raise 函 数 ) ，91 

rbody member (rbody 成 员 ) , 446 

rbuf member (rbuf 成 员 ) ，357,362-363,367-369 

read ahead (超前 读 ) ，251 

read function (read 函 数 ) ，5-6,43,49-52,54,59,61,63,70,83,90- 
91,142,161,200,204-207,249,254,260,262-263,278,304,310- 
311,322,399,406,435,451,456-457,467,469,471,482,517-519,522-523,525- 
526,533 

read lock function (read_lock 函 数 ) , 207 

definition of (read_lock 函 数 定义 ) , 202 

readers-and-writers 〈 读 出 者 与 写 入 者 ) 

locks (EH ASS AGE) ，178 

problem 〈 读 出 者 与 写 入 者 问题 )》，177 

readline function (readline Iž) ，61,63,74,518 

readw_lock function (readw. lockrA Zi) , 207-208 

definition of (readw_lock 函 数 定 义 ) , 202 

read-write lock Q5) , 177-192 

attributes CC BUB TE) ，179 

implementation using mutexes and condition variables,Posix (使 用 互 
斥 锁 和 条 件 变量 实现 Posix 读 写 锁 ) , 179-187 

real 〈 实 际 的 ) 

group ID 〈 实 际 组 ID) ，365 


userID 〈 实 际 用 户 ID , 365,369 

realtime 〈 实 时 的 ) 

scheduling〈 实 时 调度 ) ，14,160,171,454 

signals,Posix (Posix 实 时 信号 ) ，98-106 

record (WEK) ，75 

locking (记录 上 锁 ) ，193-217 

locking,file locking versu (s 对 比 文件 上 锁 与 记录 上 锁 ) ， 197-198 

recv function (recv 函 数 ) ，152 

recvfrom function (recvfromeli Zi) , 152,406 

recvmsg function (recvmsgPA 20) , 83,152 

_REENTRANT constant ( REENTRANT'[H) , 13,515 

reject stat member (reject_stat 成 员 ) , 449 

rejected. reply structure,definition of (reject stat£5 TAXE X.) , 449 

remote procedure call (远程 过 程 调用 ) , WRPC 

remote procedure call language〈 远 程 过 程 调 用 语言 ) WRPCL 

remote procedure call source code《〈 远 程 过 程 调用 源 代 码 ) ， 见 
RPCSRC 

remote terminal protocol (远程 终端 协议 ) ， 见 Telnet 





rename function (rename %t) ，91 

REPLY constant (REPLY 常 值 ) ，446 

reply. body structure,definition of 〈reply_body 结 构 定 义 ) ，447 
reply stat member (reply_stat 成 员 ) , 447 

Request for Comments 〈 请 求 评 注 ) ， 见 RFC 

reserved port〈 保 留 端口 ) 417 

reset flag, TCP header (TCP 首 部 复位 标志 ) ， 见 RST 

results member (results 成 员 ) , 447 

retransmission 〈 重 传 ) ，424,532 





RPC timeout and (RPC 超 时 与 重 传 ) ，417-422 

RFC (Request for Comments) 

1831 (RFC 1831) ，406,430,446-447 

1832 (RFC 1832) ，406,426,430 

1833 (RFC 1833) ，406,412 

Ritchie,D.M.,511,536 

rm program (rm 程序 ) , 36,376-377,379 

rmdir function (rmdir 函 数 ) , 91 

RNDUP function (RNDUPE2L) , 438 

road map,examples (示例 导读 图 ) ，15-16 

Rochkind,M.J.,27,536 

round-trip time〈 往 返 时 间 ) , 451,458 

RPC (remote procedure call),355,399-452 

and inetd program (RPC 与 RNDUP 程 序 ) , 413-414 

authentication 〈(RPC 认 证 ) , 414-417 

call semantics (RPC 调 用 语义 ) , 422-424 

call semantics,at-least-once (最 少 一 次 RPC 调 用 语义 ) , 423,450 

call semantics,at-most-once (最 多 一 次 RPC 调 用 语义 ) , 423,450 

call ”semantics,exactly-once (正好 一 次 RPC 调 用 语义 ) ， 422- 
423,450 

multithreading (RPC 多 线程 化 ) ，407-411 

packet formats (RPC 分 组 格式 ) ，444-449 

premature termination of client (RPC 客 户 过 早 终 止 ) , 424-426 

premature termination of server (RPC 服 务 句 过 早 终止 ) , 424-426 

secure 〈 安 全 RPC) ，417 

server binding (RPC 服 务 占 捆绑 ) , 411-414 

server duplicate request cach (e RPC 服 务 器 重复 请 求 高 速 缓存 ) ， 





421-424,451,532-533 

TCP connection management (RPC TCP 连 接管 理 ) , 420 

timeout and retransmission (RPC 超 时 与 重 传 ) , 417-422 

transaction ID (RPC3#4ID) , 420-422 

RPC CANTRECV constant (RPC_CANTRECV 常 值 ) ，424 

RPC_MISMATCH constant (RPC_MISMATCH 常 值 ) ，448-449 

RPC SUCCESS constant (RPC_SUCCESS 常 值 ) ，409 

rpc msg structure,definition of (rpc_msg 结 构 定 义 ) , 446 rpcbind 
program (rpcbind 程 序 ) ，406,411-412,450 

rpcgen program (rpcgen 程 序 ) , 400-406,408-409,411,413- 
414,419,427-429,432-433,435,439-440,442,449-451,476,486,534 

rpcinfo program (rpcinfo 程 序 ) , 412-414,532 

RPCL (remote procedure call language),430 

RPCSRC (remote procedure call source code),406,534 

rpcvers member (rpcvers 成 员 ) , 446 

rq cintcred member (rq_clntcred 成 员 ) , 415 

rq cred member (rq_cred 成 员 ) , 415-416 

rq proc member (rq proc) , 415 

rq prog member (rq progEX 51) , 415 

rq vers member (rq_vers 成 员 ) , 415 

rq xprt member (rq xprtb 51) , 415 

rreply member (rreply 成 员 ) , 447 

rsize member (rsize 成 员 ) , 357,362-363,367-368 

RST (reset flag, TCP header),425,532 

RTSIG MAX constant (RTSIG MAX'[H) , 100 

RW MAGIC constant CRW MAGIC'[H) , 181 


rw. condreaders member (rw. condreadersEX, 5i) , 183,186 


rw. condwriters member (rw_condwriters 成 员 ) , 184,186 
rw_magic member (rw_magic 成 员 ) ，181 

rw. mutex member (rw_mutex 成 员 ) ，181,183 

rw. nwaitreaders member (rw. nwaitreadershX 5i) , 183,191 

rw. nwaitwriters member (rw_nwaitwriters 成 员 ) , 183-184,190-191 
rw. refcount member (rw. refcounthX, 51) , 181,183-184,186 
rwlock cancelrdwait function (rwlock cancelrdwaitPÉ 2) , 191 
rwlock cancelwrwait function (rwlock cancelwrwaitrK #1) , 191 
S IRGRP constant (S IRGRP?S1H) , 23 

S IROTH constant (S IROTH?$ 1H) , 23 

S IRUSR constant (S IRUSR?$ 1H) , 23 

S ISDOOR constant (S_ISDOOR 常 值 ) 367 

S ISFIFO macro (S ISFIFO7ZZD , 44 

S IWGRP constant 〈S_IWGRP 常 值 ) 23 

S IWOTH constant (S_IWOTH 常 值 ) 23 

S IWUSR constant (S IWUSR' i£ [H) , 23 

S IXUSR constant (S IXUSR' 4H) , 111,263 

S TYPEISMQ macro (S TYPEISMQZ2 , 21 

S TYPEISSEM macro (S TYPEISSEMZ) , 21 

S TYPEISSHM macro (S TYPEISSHMZ) , 21 

SA RESTART constant (SA, RESTART'[H) , 106 

SA SIGINFO constant (SA SIGINFO?É (E) , 100-102,105-106,127 
sa flags member (sa_flags 成 员 ) , 106 

sa handler member (sa handlerkX 5i) , 106 

sa mask member (sa mask i) , 106 

sa sigaction member (sa sigactionkk 51) , 105-106 
Salus,P.H.,43,536 


sar program 《sar 程序) , 39 

sbrk function (sbrkrA Zi) , 533 

SC CHILD MAX constant ( SC CHILD MAX [ü) , 297 
scheduling,realtime 〈 实 时 调度 ) , 14,160,171,454 

Schmidt,D.C.,180 

_SC_MQ_OPEN_MAX constant (_ SC_MQ_OPEN_MAX 常 值 ) 87 
_SC_MQ_PRIO_MAX constant (. SC MQ PRIO MAX'í[ü) , 87 
scope,contention 〈 竞 用 范围 ) , 386,388,462 

_SC_OPEN_MAX constant ( SC OPEN MAX fü), 72 

SC PAGESIZE constant ( SC PAGESIZE'$1H) , 317,470,529 


.SC RTSIG MAX constant ( SC_RTSIG_MAX 常 值 )， 
102 SC SEM NSEMS MAX constant ( SC. SEM. NSEMS MAX' $ 
[H^ , 257 

.SC SEM VALUE MAX constant ( SC SEM. VALUE MAX 常 
值 ) 257,265 


secure (安全 的 ) 

NFS (安全 NFS) , 417 

RPC 〈 安 全 RPC) , 417 

security,hole 〈 安 全 漏洞 ) ，328 

SEEK_CUR constant (SEEK_CUR 常 值 ) 200,217,523 

SEEK. END constant (SEEK_END 常 值 ) ，200,217,523 

SEEK, SET constant (SEEK, SET?$1H) , 200,217,523 

select function (select Zi) , 74,95,98,151- 
152,155,171,323,339,454,519-521,528 

Posix message queues with 〈 带 Select 函数 的 Posix 消 息 队 列 ) , 95-98 

System V message queues with〈 带 select 函数 的 System V 消 息 队 
列 ) ，151-152 


Select wrapper function,source code (Select 包 里 函数 源 代码 ) , 521 

sem structure (sem 结 构 ) , 273,282-283 

definition of (sem 结 构 定 义 ) , 282 

SEM A constant (SEM _A 常 值 ) 33,283 

SEM. FAILED constant (SEM, FAILED (H) , 225 

SEM. MAGIC constant (SEM MAGIC? [H) , 258,262 

SEM, NSEMS MAX constant (SEM, NSEMS MAX?É1H) , 257 

Sem post wrapper function,source code (Sem postt)Z& p BEE 
fy) , 11 

SEM R constant (SEM_R 常 值 ) , 33,283 


SEM. UNDO constant (SEM. UNDO? fi) , 174,286- 
287,290,294,296,492 

SEM VALUE MAX constant (SEM. VALUE MAX" %18) , 
225,257 


sem base member (sem_base 成 员 ) , 282-283 

sem close function (sem closerK Z3) , 224-226,228,235,260,267,275 

definition of (sem closePKZiE X.) , 226 

source code (sem closerPK ZU JV 3) , 261,267,275 

sem ctime member (sem ctimeJi! 51) , 282-283,289 

sem destroy function (sem destroyPA 2) , 224,238-242 

definition of (sem destroyP UE X.) , 239 

sem flg member (sem flg i) , 276,285-286,492 

sem getvalue function (sem getvalueti Zt) , 224- 
225,227,262,269,277 

definition of (sem_getvalue žE X.) , 227 

source code (sem getvaluerK BRAGG) , 270,278 

sem init function 《sem_init 函 数 ) , 224,238-242,256, 


315,339,490,498 

definition of (sem_init 函 数 定 义 ) , 239 

sem magic member (sem_magic 成 员 ) , 258,262 

sem nsems member (sem_nsems 成 员 ) , 282-283,290 

sem num member (sem numJX i) , 285-286 

sem op member (sem_op 成 员 ) , 285-287 

sem open function (sem openiK 2X) , 19,22,25-26,224-226, 

228-229,232,235,239-240,242,256,258,260,263, 

265-267,271,273-274,279,285,326-327,333,498,524 

definition of (sem openrKZfzE X.) , 225 

source code (sem openPAZiJmf Vh) , 258,264,271 

sem otime member (sem_otime 成 员 ) , 273-274,282-285,296 

sem perm structure (sem_perm 结 构 ) , 283,288-289 

definition of (sem_perm 结 构 定 义 ) , 282 

sem_post function (sem postrA ZA) , 11,90-91,221- 
225,227,238,242,256-257,260,267,275,279,287,456,490 

definition of (sem postiKZiE X.) , 227 

source code (sem postPAZ 4E X.) , 261,268,276 

sem t datatyp (e sem_t 数 据 类 型 ) , 8,225,238- 
240,242,256,258,260,262-263,265-266,271,275,326 

sem trywait function (sem trywaitPK| 数 ) , 224-227,262,269,276,339 

definition of (sem_trywait 函 数 定 义 ) , 226 

source code (sem_trywait K BRAGS) ，270,277 

sem_unlink function (sem unlinkrAZX) , 224- 
226,235,242,260,267,275,305,327,333 

definition of (sem unlinkrKZK;E X.) , 226 

source code (sem unlinkrA AERIS) , 261,268,276 


sem_wait function (sem, waite #0) , 221- 
227 ,230,232,236,238,242,256,258,262,268-269,275-276,279,287,339,524- 
925 

definition of (sem_wait 函 数 定 义 ) , 226 

source code (sem waitPA Zi Jf V3) ，262,269,277 

semadj member (semadj 成 员 ) , 10,286-287,294 

semaem variable (semaem 变 量 ) , 37-38,296 

semaphore.h header (semaphore.h3k X fF) , 258,262,271 
semaphores (信号 量 ) 

between processes,Posix〔 进 程 间 共享 Posix 信 号 量 ) ， 256-257 

binary (二 值 信号 量 ) , 219,281 

counting (计数 信号 量 ) ，221,281 

file locking using Posix (使 用 Posix 信 号 量 执行 文件 上 锁 ) ，238 

file locking using System V (fii System V 信 号 量 执行 文件 上 锁 ) ， 
294-296 

ID (fa SID) , 271,283,290,300 

implementation using FIFOS,Posix《〈 使 用 FIFO 实 现 Posix 信 号 量 ) ， 
257-262 

implementation using memory-mapped I/O,Posix 〈 使 用 内 存 映 射 TO 实 
现 Posix 信 号 量 ) ，262-270 

implementation using System V semaphores,Posix 〈 使 用 System V 信 

号 量 实现 Posix 信 和 号 量 ) ，271-278 

limits,Posix 〈Posix 信 号 量 限制 ) ，257 

limits,System V (System V 信 号 量 限制 ) ，296-300 

Posix (Posix 信 号 量 ) , 219-279 

System V (System V 信 号 量 ) ，281-300 

sembuf structure (sembuf 结 构 ) ，285-286,290,296 


definition of (sembuf 结 构 定 义 ) , 285 

semctl function (semctl K% , 273-275,277,283-284,287-290,294 

definition of (semctl 函 数 定 义 ) , 287 

semget function (semgetPA Zi) , 34,38,257,273-275,282- 
285,290,294,526 

definition of (semget 函 数 定 义 ) , 282 

semid ds structure (semid_ds 结 构 ) , 282-284,288-290 

definition of (semid ds 结构 定义 ) , 282 

semmap variable (semmap 变 量 ) ，37 

semmni variable (semmni 变 量 ) , 37-38,296 

semmns variable (semmns 变 量 ) , 37,296 

semmnu variable (semmnu 变 量 ) , 37,296 semmsl variable (semmsl 
变量 ) , 37-38,296 

semncnt member (semncnth 5i) , 282-283,286-288 

semop function (semopri#{) , 273,275-276,283- 
287 ,290,294,296,492,525-526 

definition of (semoprAZitxE X.) , 285 

semopm variable (semopm® Œ) , 37-38,296 

sempid member (sempid 成 员 ) , 282-283,288 

semume variable (semume 变 量 ) , 37-38,296 

semun structure (semun 变 量 ) , 506 

definition of (semun 变 量 定 义 ) , 288 

semval member (semval 成 员 ) ，282-283,286-288 

SEMVMX constant (SEMVMX 常 值 ) 273 

semvmx variable (semvmx 变 量 ) , 37-38,296 

semzcnt member (Semzcnt 成 员 ) ，282-283,286-288 

sendmsg function (sendmsgri#) , 384 


sendto function (sendtorK Zt) , 405 

seq member (seq 成 员 ) ，34-35,38 

sequence number,slot usage〈 覃 位 使 用 序列 号 ) ，34 

server 服务器) 

binding, RPC (RPCHkKA 281820) , 411-414 

concurrent 〈 并 发 服务 器 ) » 66-67,147,357,372,407 

creation procedure〈 服 务 器 创建 过 程 ) ，384 

duplicate request cache,RPC 〈RPC 服 务 器 重复 请 求 高 速 缓存 ) ，421- 
424,451,532-533 

iterative GUIAS 28) » 66-67,144,372,407-408 

stub 《服务 器 程序 存根 〉，405 

server function (server Zi) ，48-49,54-55,63,72,141-142,144,149 

session (Zik) , 4 

set concurrency function (set concurrency PAZ) , 163,165,488 

SETALL constant (SETALL?$[H) , 283-284,288,290 

setgid function 〈setgid 函 数 ) , 91 

set-group-ID (SGID) , 26,198,205 

setpgid function (setpgid 函 数 ) , 91 

setrlimit function (setrlimitei2) , 72 

setsid function (setsid 函 数 ) , 91 

setsockopt function 〈setsockopt 函 数 ) , 418 

setuid function 〈《setuid 函 数 ) , 91 

set-user-ID (SUID) , 26,205,369 

SETVAL constant (SETVAL#i E) , 273,283-284,288 

setvbuf function (setvbuf Až) , 522 

sh program (sh 程序 ) , 52 

Shar,D.,180,536 
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ID 〈 共 享 内 存 区 ID) ，344,351 

limits,System V (System V 共 享 内 存 区 限制 ) ，349-351 
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SHM_W constant (SHM, WR) , 33 

shm atime member (shm_atime 成 员 ) , 343 
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shm_segsz member (shm segszkX 51) ，343 
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definition of (shmdt 函 数 定 义 ) ，345 
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shmmni variable (shmmni 变 量 ) , 37-38,349 
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SIGEV THREAD constant (SIGEV THREAD? [H) , 98,128 

sigev notify member (sigev notifyEk 51) , 88-89,98 
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signal rt function (signal rte 20) ，102,105-106 

source code (signal rtPK BR fV d) , 105 
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st mode member (st modeJ 5i) , 21,44,115,267,328,367 

st size member (st size! X 91) , 74,262,328 

st uid member (st_uid 成 员 ) , 328 
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source code (stop_time 函 数 源 代码 ) , 470 
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streams versus messages〈 对 比 流 与 消息 ) ，67-72 
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svc. dg. enablecache function (svc dg enablecacherK Zi) , 422 
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«sys/errno.h» header («sys/errno.h» A X fF) , 13,503 
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tar program (tar 程 序 ) , 13 

tcdrain function (tcdrain 函 数 ) , 91 
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tcflush function (tcflush 函 数 ) , 91 
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connection management; RPC (RPC TCP 连 接管 理 ) , 420 
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termination of client C£ P! Z€ IE) 
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thr setconcurrency function 〈thr_setconcurrency 函 数 ) , 163 
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time function (time 隙 数 ) 91 
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TLI (Transport Layer Interface), AP CI 传输 层 接口 API) , 406 
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explicit〈 显 式 类 型 指定 ) ，426 
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bool t clnt control(CLIENT *cl, unsigned int request, char *ptr); 418 
CLIENT  *clnt create(const char *host, unsigned long prognum, 
unsigned long versnum, const char *protocol); 401 


void clnt destroy(CLIENT ‘*cl) ; 420 














int door bind(int fd); 390 
int door call(int fd, door arg t *argp); 361 
int door create(Door server proc *proc, void *cookie, u int attr); 363 
int door cred(door cred t *cred): 365 
int door info(int fd, door info t *info); 365 
int door return(char *dataptr, size t datasize, door desc t *descptr, size t ndesc); 365 
int door revoke(int fd); 390 
Door create proc  *door server create(Door create proc *proc); 384 
int door unbind(void); 390 
void err dump(const char *fmt, ...); 512 
void err msg(const char *fmt, ...); 512 
void err quit(const char *fmt, ...); 512 
void err ret(const char *fmt, ...); 511 
void err sys(const char *fml, ...); a 511 
int fentl(int fd, int cmd, ... /* struct flock *arg */ ); 199 
int fstat(int fd, struct stat *buf); 328 
key t ftok(const char “pathname, int id); 28 
int ftruncate(int fd, off t length); 327 
int mkfifo(const char *pathname, mode t mode) ; 54 
void *mmap(void *addr, size t len, int prot, int flags, int fd, off c offset); 308 
int msync(void *addr, size t len, int flags); 310 
int munmap(void *addr, size t len); 309 
int mq close(mqd t m@des) ; 77 
int mq getattr(mqd t mgdes, struct mq attr *attr); 79 
int mq notify (mqd t mqdes, const struct sigevent *notification) ; 87 
mqd t mq open(const char *name, int oflag, 

/* mode t mode, struct mq attr *atir */ ); 76 
ssize t mq receive(mqd t mqdes, char *pir, size t len, unsigned int *priop); 83 
int mq send(mqgd t mqdes, const char *ptr, size t len, unsigned int prio); 83 
int mq setattr(mqd t mgdes, const struct mq attr ‘attr, struct mq attr *oattr); 79 
int mq unlink(const char *name); 77 
int msgctl(int msgid, int cmd, struct msqid ds *buff) ; 134 
int msgget(key t key, int oflag); 130 
ssize t msgrcv(int msqid, void *ptr, size t length, long type, int flag); 132 
int msgsnd(int msgid, const void *ptr, size t length, int flag); 131 
int pelose(FILE *stream); 52 
int pipe(int fd[2]); 44 


N 


FILE *popen(const char *command, const char *type) ; 5 
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int pthread_cancel (pthread_t fid); 187 
void pthread_cleanup_pop(int execute) ; 187 
void pthread cleanup push(void (*function) (void *), void *arg); 187 


int pthread create(pthread t *lid, const pthread attr t ‘attr, 
void *(*func) (void *), void *arg); 


502 
int pthread detach(pthread t tid); 504 
void pthread exit(void *status); 504 
int pthread join(pthread t tid, void **status) ; 503 


pthread t pthread self (void); 503 
int pthread condattr destroy(pthread condattr t *attr); 172 
int pthread condattr getpshared(const pthread condattr t *attr, int *valptr) ; 173 
int pthread condattr init(pthread condattr t *attr); 172 
int pthread condattr setpshared(pthread condattr t ‘attr, int value); 173 
int pthread cond broadcast(pthread cond t *cptr); 171 
int pthread cond destroy(pthread cond t *gptr); 172 
int pthread cond init(pthread cond t *cptr, const pthread condattr t *attr) ; 172 
int pthread cond signal(pthread cond t *cptr); 167 
int pthread cond timedwait(pthread cond t *cpjr, pthread mutex t *mptr, 
const struct timespec *abstime) ; 171 
int pthread cond wait(pthread cond t *cptr, pthread mutex t *mptr) ; 167 
int pthread mutexattr destroy(pthread mutexattr t *attr) ; 172 
int pthread mutexattr getpshared(const pthread mutexattr t *attr, int *valptr) ; 173 
int pthread mutexattr init(pthread mutexattr t *attr) ; 172 
int pthread mutexattr setpshared(pthread mutexattr t *attr, int value); 173 
int pthread mutex destroy(pthread mutex t *mptr); 172 
int pthread mutex init(pthread mutex t *mptr, const pthread mutexattr t ‘attr); 172 
int pthread mutex lock(pthread mutex t "mptr) ; 160 
int pthread mutex trylock(pthread mutex t *mptr) ; 160 
int pthread mutex unlock(pthread mutex t *mptr); 160 
int pthread rwlockattr getpshared(const pthread rwlockattr t ‘attr, int *valptr); 179 
int pthread rwlockattr init(pthread rwlockattr t *attr); 179 
int pthread rwlockattr setpshared(pthread rwlockattr t *attr, int value); 179 
int pthread rwlock destroy(pthread rwlock t *ruptr); 179 
int pthread rwlock init(pthread rwlock t *ruptr, 
const pthread rwlockattr t *attr); 179 
int pthread rwlock rdlock(pthread rwlock t *ruptr); 178 
int pthread rwlock tryrdlock(pthread rwlock t *ruptr); 178 
int pthread rwlock trywrlock(pthread rwlock t *ruptr); 178 
int pthread rwlock unlock(pthread rwlock t *rwptr) ; 178 


int pthread rwlock wrlock(pthread rwlock t *ruptr); 178 





pr thread id(pthread t *ptr); 


long 
char 
int 
int 
int 
int 


sem t 


int 
int 
int 
int 
int 
int 
int 
int 
int 
void 
int 
int 


int 


型 


*px ipc name(const char *name); 

sem close(sem t *sem); 

sem destroy(sem t *sem); 

sem getvalue(sem t *sem, int *valp) ; 

sem init(sem t *sem, int shared, unsigned int value); 


*sem open(const char *name, int oflag, 
/* mode t mode, unsigned int value */ ); 


sem post(sem t *sem); 

sem trywait(sem t *sem); 

sem unlink(const char *name); 

sem wait(sem t *sem); 

semctl(int semid, int semnum, int cmd, ... /* union semun arg */ ); 
semget(key t key, int nsems, int oflag); 

semop(int semid, struct sembuf *opsptr, size t nops); 

shm open(const char *name, int oflag, mode t mode); 

shm unlink(const char *name); 

*shmat(int shmid, const void *shmaddr, int flag); 
shmctl(int shmid, int cmd, struct shmid ds *buff); 
shmät (const void *shmaddr) ; 
shmget(key t key, size t size, int oflag) ; 


Sigfunc rt  *signal rt(int signo, Sigfunc rt *func); 


int 
int 
doubl 
int 
int 


void 


sigwait (const sigset t *set, int *sig); 

start time(void); 

e stop time(void); 

svc dg enablecache(SVCXPRT *xprt, unsigned long size); 
touch(void *uvptr, int nbytes); 


tv sub(struct timeval *out, struct timeval *in); 


105 


470 
470 
422 
470 
471 
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accepted_reply 
authsys_parms 


call body 


d desc 


door, arg t 
door cred t 
door desc t 
door info t 


flock 


ipc perm 


mismatch info 


mq attr 
msgbuf 


msg_perm 
msqid_ds 


opaque_auth 


rejected_reply 
reply body 


rpc. msg 


sem 
sembuf 
semid ds 
sem perm 
semun 
shmid ds 
shm perm 
Sigaction 
sigevent 
siginfo t 
sigval 
stat 

svc req 


timespec 


171 


